Ein Experiment an der Ruhr-Universität Bochum offenbart die Grenzen klassischer Prüfungsformate im Zeitalter generativer KI.
Wie belastbar ist das Format Hausarbeit noch? Jan David Hendricks und Fabien Josten wollten es wissen. In Abstimmung mit dem Lehrstuhl von Prof. Dr. Jacob Joussen reichten sie an der juristischen Fakultät der Ruhr-Universität Bochum eine Schuldrecht-AT-Arbeit ein, deren Gutachtentext vollständig von ChatGPT stammte. Vier Korrektoren bewerteten die Arbeit, ohne vom Experiment zu wissen. Das Ergebnis: 3, 6, 6 und 8 Punkte. Mit einem Schnitt von 5,75 Punkten lag die KI-Arbeit knapp unter dem Gesamtdurchschnitt aller 241 Einreichungen (6,05 Punkte). Kein Korrektor schöpfte Verdacht.
Die Autoren verwendeten ausschließlich die kostenlose ChatGPT-Version mit den Modellen GPT-5 und 4o. Wegen des begrenzten Tokenlimits teilten sie das Gutachten in drei Abschnitte auf. Der Clou: Eine vorab generierte Lösungsskizze mit prozentualer Gewichtung der Prüfungsschritte sorgte für konsistente Schwerpunkte über alle Teile hinweg. In den generierten Text griffen Hendricks und Josten inhaltlich nicht ein. Lediglich der Fußnotenapparat erforderte manuelle Arbeit, da ChatGPT keinen Zugang zu juristischen Datenbanken besitzt. Der Gesamtaufwand: etwa zwei bis drei Tage.
Die Schwächen fielen klassisch aus: mangelnder Normbezug, oberflächliche Schwerpunktsetzung, zu geringe argumentative Tiefe. Die Stärken ebenfalls: sachgerechte Ergebnisse und erkennbare Beherrschung komplexer BGB-AT-Normen. Die KI verfehlte die Musterlösung nicht grundlegend, sondern blieb bei Detailfragen hinter den Erwartungen zurück.
KI-Verbote lassen sich in Hausarbeiten kaum durchsetzen. Universitäten setzen auf Selbstverpflichtungserklärungen und Kennzeichnungspflichten. Hendricks und Josten sehen das Format dennoch am Scheideweg: Die Grenze zwischen Eigenleistung und Prompting verschwimmt. Schon eine generierte Lösungsskizze verschafft erhebliche Vorteile. Das Fazit der Autoren fällt eindeutig aus: Die Tage der althergebrachten Hausarbeit als Prüfungsformat sind gezählt.





