Files
Klotzkette--claude-fuer-deu…/audit
Klotzkette 1c57dc8948 docs(audit): Welle 4 Reparatur-Status zu Halluzinations-Audit ergaenzt
Welle 4 (Selbstvertreter-Skills PR #115): 156 Skills geprueft, 6 echte
AZ gefunden, 2 davon halluziniert und korrigiert. Halluzinationsquote
33% in diesem Subset, vergleichbar mit Audit-Gesamtquote 30,2%.
2026-05-27 16:29:04 +00:00
..

Audit-Verzeichnis

Dieses Verzeichnis dokumentiert Halluzinations-Audits ueber alle Aktenzeichen in den SKILL.md-Dateien des Repos.

Wellen

Welle Datum Umfang Status
1 — Stichprobe v14.2.4 27.05.2026 25 Skills aus User-Report abgeschlossen, in v14.2.4 gefixt
2 — Vollaudit 27.05.2026 3228 unique AZ, 22 parallele Subagenten abgeschlossen, Befunde in audit_problems_2026-05-27.json

Welle 2 — Methodik

22 parallele Subagenten haben je ~147 unique Aktenzeichen geprueft. Pro AZ:

  1. pplx search web "<court> <az>" gegen dejure.org / openJur / bundesgerichtshof.de / curia.europa.eu
  2. Vergleich des im Skill behaupteten Themas mit der echten Entscheidung
  3. Klassifikation:
    • OK: AZ existiert und Kontext passt
    • WRONG_TOPIC: AZ existiert, aber Kontext beschreibt anderen Sachverhalt
    • NOT_FOUND: AZ findet sich nicht
    • UNVERIFIABLE: Quellenlage zu duenn

Ergebnis Welle 2

  • 3228 unique Aktenzeichen geprueft
  • 1062 OK (32,9 %)
  • 893 UNVERIFIABLE (27,7 %) — meist OLG/LG/FG ohne oeffentlichen Volltext
  • 621 WRONG_TOPIC (19,2 %)
  • 355 NOT_FOUND (11,0 %)
  • 976 Problemfaelle (30,2 %) sind in audit_problems_2026-05-27.json detailliert aufgelistet

Hinweis zur Datenqualitaet

Der hohe WRONG_TOPIC-Anteil zeigt: das Aktenzeichen existiert, aber die im Skill behauptete Aussage trifft nicht auf das tatsaechliche Urteil zu. Typische Muster sind falsche Senate (z.B. IX ZR statt VIII ZR), falsche Jahrgaenge oder voellig andere Themen unter identischem AZ.

Diese Faelle muessen in einer Folge-Welle (Welle 3 — Reparatur) systematisch bereinigt werden: betroffene Skill-Stellen entweder ersatzlos streichen oder durch verifizierte AZ ersetzen.

Die UNVERIFIABLE-Faelle sind nicht zwangslaeufig fehlerhaft; sie konnten nur ohne juris-/Beck-Zugang nicht abschliessend gegengeprueft werden.

Folgeschritte

  1. Welle 3 — Reparatur: 976 Problemfaelle systematisch fixen
  2. Optional: 893 UNVERIFIABLE mit juris/Beck-Zugang nachpruefen
  3. CI-Hook etablieren, der neue AZ-Aufnahmen gegen dejure-API gegenprueft