WikiLLM

WikiLLM-Technologie

Von Rohdokumenten zum kompilierten Unternehmensgedächtnis — nicht RAG, sondern Wissenskompilierung.

Die Kernidee: Kompiliertes Wissen statt RAG

Traditional RAG

Dokumente in Chunks zerlegt
Bei jeder Frage: Vector-Suche
Wissen wird jedes Mal von Null aufgebaut

Nichts akkumuliert sich. Kein Lerneffekt.

WikiLLM (ROZUM)

Quelle wird gelesen und integriert
Persistentes Wiki: verlinkt, aktualisiert
Wissen kompiliert sich, wächst, bleibt aktuell

Jede Quelle bereichert das Gesamtwissen.

Die meisten KI-Systeme arbeiten mit RAG: Bei jeder Anfrage werden Dokumentfragmente gesucht und zusammengesetzt. Das Wissen wird jedes Mal von Null aufgebaut — nichts akkumuliert sich.

WikiLLM arbeitet anders. Statt bei jeder Anfrage Wissen neu zusammenzusuchen, baut das System ein persistentes, verlinktes Wiki auf — ein strukturiertes Netz aus Zusammenfassungen, Entitäten, Konzepten und Querverweisen. Neues Wissen wird einmal kompiliert und dann aktuell gehalten.

Die Idee basiert auf dem Konzept von Andrej Karpathy (LLM Wiki): Das LLM wird zum disziplinierten Wiki-Pfleger. Es liest Quellen, extrahiert Kerninformationen, aktualisiert bestehende Seiten und pflegt Querverweise — automatisch und nachvollziehbar.

Vier-Ebenen-Architektur

ROZUM erweitert die WikiLLM-Idee um Enterprise-Governance.

Ebene 1

Source & Provenance

Unveränderliche Rohdaten mit SHA-256-Hash, Versionen, ACL-Snapshots und Herkunftsnachweis. SharePoint, Netzlaufwerke, ERP, PDF-Archive.

SHA-256 HashACL SnapshotsVersion ControlSource Lineage
Governance an jedem Übergang
Ebene 2

Compiled Knowledge

Zusammenfassungen, Entitäten, Konzepte, Vergleiche, Widersprüche — strukturiert, verlinkt und mit Quellenangabe. Das persistente Unternehmens-Wiki.

SummariesEntitiesConceptsCross-References
Governance an jedem Übergang
Ebene 3

Retrieval & Reasoning

Hybrid-Suche: Tree-Reasoning, lexikalische und Vektor-Suche, Graph-Traversal, Reranking, Quellenprüfung, kalibrierte Verweigerung bei unzureichender Evidenz.

Hybrid SearchRerankingCitation VerificationCalibrated Refusal
Governance an jedem Übergang
Ebene 4

Governance & Control

Identitätsmanagement, Richtlinien, ACL-Synchronisation, Audit-Trail, Aufbewahrung, Löschung — angewendet bei jedem Übergang, nicht als äußere Hülle.

IdentityPoliciesAudit TrailDeletion Propagation

Permission-Aware Knowledge

Das Kritische, was WikiLLM allein nicht löst: Wenn eine Wissensseite aus drei Dokumenten mit unterschiedlichen Berechtigungen erstellt wird, sieht ein Nutzer sie nur, wenn er Zugang zu allen relevanten Quellen hat. Berechtigungen werden vererbt, nicht ignoriert.

derived_acl = intersection(source_acl_sets)
Berechtigungsvererbung
Doc A
ACL: R1,R2
Doc B
ACL: R2,R3
Doc C
ACL: R1,R2,R3
Kompilierte Wissensseite
derived_acl = R2 (intersection)
R2 User: ✓
R1 User: ✗
R3 User: ✗

Kostenvergleich: Lokal vs. Cloud

Open-Source LLMs auf Ihrem Server eliminieren laufende Token-Kosten. Die Differenz wächst mit jeder zusätzlichen Nutzung.

ROZUM LokalCloud API
Token-Kosten/Jahr~€200-500 (Strom)€10.000-20.000
Hardware (einmalig)€4.000-8.000
SkalierungKostenlosLinear steigend
Vendor Lock-inKeinsHoch

Unterstützte Modelle

Alle Modelle: MIT/Apache-Lizenz, kommerzielle Nutzung erlaubt, kein Vendor Lock-in.

Qwen 3 70B

Parameters70B
VRAM40GB+
QualitätHoch
Use CaseHauptmodell

Llama 4 Scout

Parameters17B
VRAM10-16GB
QualitätMittel-Hoch
Use CaseKompakt

Mistral Large 2

Parameters123B
VRAM70GB+
QualitätHoch
Use CaseLeistungsstark

Gemma 4 27B

Parameters27B
VRAM16GB
QualitätMittel
Use CaseEdge

Bereit für souveräne KI?