WikiLLM

WikiLLM-Technologie

Von Rohdokumenten zum kompilierten Unternehmensgedächtnis — nicht RAG, sondern Wissenskompilierung.

Die Kernidee: Kompiliertes Wissen statt RAG

Traditional RAG

Dokumente in Chunks zerlegt

Bei jeder Frage: Vector-Suche

Wissen wird jedes Mal von Null aufgebaut

Nichts akkumuliert sich. Kein Lerneffekt.

WikiLLM (ROZUM)

Quelle wird gelesen und integriert

Persistentes Wiki: verlinkt, aktualisiert

Wissen kompiliert sich, wächst, bleibt aktuell

Jede Quelle bereichert das Gesamtwissen.

Die meisten KI-Systeme arbeiten mit RAG: Bei jeder Anfrage werden Dokumentfragmente gesucht und zusammengesetzt. Das Wissen wird jedes Mal von Null aufgebaut — nichts akkumuliert sich.

WikiLLM arbeitet anders. Statt bei jeder Anfrage Wissen neu zusammenzusuchen, baut das System ein persistentes, verlinktes Wiki auf — ein strukturiertes Netz aus Zusammenfassungen, Entitäten, Konzepten und Querverweisen. Neues Wissen wird einmal kompiliert und dann aktuell gehalten.

Die Idee basiert auf dem Konzept von Andrej Karpathy (LLM Wiki): Das LLM wird zum disziplinierten Wiki-Pfleger. Es liest Quellen, extrahiert Kerninformationen, aktualisiert bestehende Seiten und pflegt Querverweise — automatisch und nachvollziehbar.

Vier-Ebenen-Architektur

ROZUM erweitert die WikiLLM-Idee um Enterprise-Governance.

Ebene 1

Source & Provenance

Unveränderliche Rohdaten mit SHA-256-Hash, Versionen, ACL-Snapshots und Herkunftsnachweis. SharePoint, Netzlaufwerke, ERP, PDF-Archive.

SHA-256 HashACL SnapshotsVersion ControlSource Lineage

Governance an jedem Übergang

Ebene 2

Compiled Knowledge

Zusammenfassungen, Entitäten, Konzepte, Vergleiche, Widersprüche — strukturiert, verlinkt und mit Quellenangabe. Das persistente Unternehmens-Wiki.

SummariesEntitiesConceptsCross-References

Governance an jedem Übergang

Ebene 3

Retrieval & Reasoning

Hybrid-Suche: Tree-Reasoning, lexikalische und Vektor-Suche, Graph-Traversal, Reranking, Quellenprüfung, kalibrierte Verweigerung bei unzureichender Evidenz.

Hybrid SearchRerankingCitation VerificationCalibrated Refusal

Governance an jedem Übergang

Ebene 4

Governance & Control

Identitätsmanagement, Richtlinien, ACL-Synchronisation, Audit-Trail, Aufbewahrung, Löschung — angewendet bei jedem Übergang, nicht als äußere Hülle.

IdentityPoliciesAudit TrailDeletion Propagation

Permission-Aware Knowledge

Das Kritische, was WikiLLM allein nicht löst: Wenn eine Wissensseite aus drei Dokumenten mit unterschiedlichen Berechtigungen erstellt wird, sieht ein Nutzer sie nur, wenn er Zugang zu allen relevanten Quellen hat. Berechtigungen werden vererbt, nicht ignoriert.

derived_acl = intersection(source_acl_sets)

Berechtigungsvererbung

Doc A

ACL: R1,R2

Doc B

ACL: R2,R3

Doc C

ACL: R1,R2,R3

Kompilierte Wissensseite

derived_acl = R2 (intersection)

R2 User: ✓

R1 User: ✗

R3 User: ✗

Kostenvergleich: Lokal vs. Cloud

Open-Source LLMs auf Ihrem Server eliminieren laufende Token-Kosten. Die Differenz wächst mit jeder zusätzlichen Nutzung.

	ROZUM Lokal	Cloud API
Token-Kosten/Jahr	~€200-500 (Strom)	€10.000-20.000
Hardware (einmalig)	€4.000-8.000	—
Skalierung	Kostenlos	Linear steigend
Vendor Lock-in	Keins	Hoch

Unterstützte Modelle

Alle Modelle: MIT/Apache-Lizenz, kommerzielle Nutzung erlaubt, kein Vendor Lock-in.

Qwen 3 70B

Parameters70B

VRAM40GB+

QualitätHoch

Use CaseHauptmodell

Llama 4 Scout

Parameters17B

VRAM10-16GB

QualitätMittel-Hoch

Use CaseKompakt

Mistral Large 2

Parameters123B

VRAM70GB+

QualitätHoch

Use CaseLeistungsstark

Gemma 4 27B

Parameters27B

VRAM16GB

QualitätMittel

Use CaseEdge

Bereit für souveräne KI?

Design-Partner werden