Wenn Maschinen besser dozieren als Menschen

News

KI & Tech

Wenn Maschinen besser dozieren als Menschen

June 18, 2026

26.06.2026

3 Minuten Lesezeit

Legal

KI & Tech

Eine aktuelle Untersuchung aus Stanford zeigt ein verblüffendes Bild: Vertragsrechtsprofessoren wählten in einem anonymen Vergleich überwiegend die Antworten von Sprachmodellen statt jene ihrer eigenen Kollegen. In drei von vier Fällen hatten die Maschinen die Nase vorn.

Der kritischste Prüfer wählte trotzdem oft die KI

Ein einzelner Wert aus der Erhebung bringt das Ergebnis auf den Punkt. Selbst jene Person unter den Bewertenden, die maschinellen Antworten am misstrauischsten gegenüberstand, gab in 56 Prozent ihrer Entscheidungen dennoch den Modellen den Vorzug. Im Durchschnitt fiel das Urteil noch deutlicher aus. Die Quoten der beiden eingesetzten Systeme Gemini 2.5 und NotebookLM bewegen sich um die Marke von drei Vierteln aller Vergleiche, während sich die menschlichen Lehrkräfte mit einem knappen Viertel zufriedengeben mussten.

Wer steckt hinter dem Versuch

Hinter der Erhebung stehen Forschende der Universität Stanford gemeinsam mit Kolleginnen und Kollegen anderer juristischer Fakultäten. Sechzehn Vertragsrechtslehrende stellten sich zur Verfügung, die alle dasselbe Lehrbuch im Unterricht verwenden. Aus ihrem Kreis stammen auch die vierzig Fragen, an denen sich Mensch und Maschine messen mussten. Auf Seiten der Technologie traten Gemini 2.5 Pro von Google sowie NotebookLM an, wobei letzteres direkten Zugriff auf das vertraute Lehrwerk hatte.

Wo die Modelle besonders glänzten

Spannend ist weniger das reine Zahlenverhältnis als die Verteilung über verschiedene Aufgabentypen. Bei knappen Wissensfragen punktet Künstliche Intelligenz erwartbar. Doch auch dort, wo es kniffliger wird, hielten die Modelle ihren Vorsprung. Hypothetische Fallkonstellationen und Fragen zu Grundsätzen der Rechtspolitik gelten in der Ausbildung als Königsdisziplin, weil dort weniger das Auswendigwissen zählt als die Fähigkeit zur Abwägung. Genau in diesen Bereichen blieben die Modelle erfolgreich.

Pädagogische Tauglichkeit unter der Lupe

Über die schlichte Vorlieben-Frage hinaus interessierte die Forschenden, wie oft eine Antwort Studierenden eher schaden als nutzen würde. Bei den Sprachmodellen kam dieses Etikett kaum zum Einsatz, lediglich um die dreieinhalb Prozent. Auf menschlicher Seite war die Streuung erheblich größer. Manche Lehrkraft kam mit einem Wert um ein Prozent davon, andere mussten sich fast 40 Prozent ihrer Antworten als bedenklich markieren lassen. Im Mittel landete die menschliche Quote bei rund zwölf Prozent.

Mehr als nur eine Frage des Stils

Es liegt nahe zu vermuten, die Maschinen gewännen vor allem durch Ausführlichkeit oder rhetorischen Schliff. Auch dieser Frage ging das Team nach. Tatsächlich neigen längere Texte zu besseren Bewertungen. Andere formale Merkmale wie Lesbarkeit oder Strukturierung reichten jedoch nicht aus, um den deutlichen Vorsprung zu erklären. Was übrig bleibt, deutet auf eine echte inhaltliche Stärke der Modelle hin.

Geteilter Maßstab statt persönlicher Vorlieben

Ein weiterer Einwand wäre, dass die Bewertenden möglicherweise einfach Eigenheiten der KI-Texte mochten. Auch dieser Verdacht wurde geprüft. Die Übereinstimmung zwischen den verschiedenen Bewertenden lag deutlich höher, als reiner Zufall oder individuelle Geschmacksfragen es hätten erwarten lassen. Daraus folgern die Autoren, dass ein gemeinsames professionelles Qualitätsverständnis am Werk war.

Verwandte Artikel

Wenn Software einen eigenen Pass bekommt

June 22, 2026

23.06.2026

3 Minuten Lesezeit

Estland will den Umgang mit autonom handelnder Software neu denken. Statt sich auf die Anmeldedaten ihrer Auftraggeber zu stützen, sollen KI-Agenten dort künftig eine ganz eigene Identität tragen.

Lernen per Smartphone: ASW bringt KI-Schulung für Kanzleien

June 19, 2026

28.06.2026

2 Minuten Lesezeit

Die Akademie der Steuerberater und Wirtschaftsprüfer reagiert mit einer eigenen App auf den Vormarsch Künstlicher Intelligenz im Kanzleialltag. Im Mittelpunkt stehen rechtliche Fallstricke und Haftungsfragen.

KI bei der Deutschen Bank: Wenn aus zwei Jahren plötzlich Monate werden

June 19, 2026

26.06.2026

2 Minuten Lesezeit

Bei der Deutschen Bank wirken sich KI-Werkzeuge spürbar auf die Bearbeitungszeiten aus. Manche Vorhaben schrumpfen von Jahren auf wenige Monate. Zugleich wächst die Sorge um die Kosten, da Anbieter ihre Preise zunehmend an den Verbrauch koppeln.

Tempo schlägt Sorgfalt: KI-Einführung in deutschen Firmen

June 18, 2026

24.06.2026

3 Minuten Lesezeit

Während die Bedeutung der Datensouveränität in deutschen Chefetagen weitgehend bekannt ist, wird die Einführung von KI-Werkzeugen häufig vorangetrieben, bevor die nötigen Schutzmechanismen stehen. Das zeigt eine neue Erhebung des Softwareanbieters Veeam.

Aktuelle Stellenangebote

EuGH segnet Vermögenstausch von E.ON und RWE ab

Mehr Themen entdecken

Rödl wächst auf 785 Mio. Euro Umsatz

Vom Sprung in die digitale Finanzwelt ist wenig zu sehen

Marco Amitrano übernimmt erweiterte Rolle bei PwC

FINN knackt Unicorn-Status: SevenVentures steigt ein

Notheis: Der Investmentbanker, der nicht untergeht

Eurazeo sichert pan-europäische Infrastruktur

Daniel Möritz wechselt von Hengeler Mueller zu Freshfields

Hogan Lovells begleitet The Mobility House bei Verkauf an Edenred

Wolf Theiss begleitet UBM bei 35-Millionen-Verkauf

Condor beruft neuen CFO und CCO

BMW-Schock: Gewinnwarnung und Stellenabbau drohen

Ende einer Ära: Vanguard überholt BlackRock nach 23 Jahren

Wenn Software einen eigenen Pass bekommt

Lernen per Smartphone: ASW bringt KI-Schulung für Kanzleien

KI bei der Deutschen Bank: Wenn aus zwei Jahren plötzlich Monate werden

McKinsey Schweiz befördert erstmals drei Frauen zur Senior Partnerin

35 Grad im Büro: Was Beschäftigte wirklich dürfen

Rentenkommission: Das ändert sich für alle

Wenn Maschinen besser dozieren als Menschen

Der kritischste Prüfer wählte trotzdem oft die KI

Wer steckt hinter dem Versuch

Wo die Modelle besonders glänzten

Pädagogische Tauglichkeit unter der Lupe

Mehr als nur eine Frage des Stils

Geteilter Maßstab statt persönlicher Vorlieben

Verwandte Artikel

Wenn Software einen eigenen Pass bekommt

Lernen per Smartphone: ASW bringt KI-Schulung für Kanzleien

KI bei der Deutschen Bank: Wenn aus zwei Jahren plötzlich Monate werden

Tempo schlägt Sorgfalt: KI-Einführung in deutschen Firmen

Aktuelle Stellenangebote

Steuerspezialist in der freien Wirtschaft (M/W/D)

Manager Transfer Pricing

Rechtsanwalt Arbeitsrecht (M/W/D)

Senior Consultant / Manager Global Mobility Advisory (M/W/D)

Steuerexperte Hauptbuchhaltung (M/W/D)

Manager Financial Due Diligence

Steuerberater / Steuerjurist Steuerliche Gestaltungsberatung (M/W/D)

Rechtsanwalt Steuerstrafrecht (M/W/D)

Steuerassistent Investment Tax (M/W/D)

(Senior) Manager Zoll & Verbrauchssteuern (M/W/D)

Financial Controller (M/W/D)

Steuerassistent / Steuerberater Real Estate Tax (M/W/D)

Senior Manager Accounting Advisory (m/w/d)

Tax Manager in der Industrie (M/W/D)

Steuerberater 100% remote (M/W/D)

Die wichtigsten News. Kompakt. Kostenlos.

Meistgelesene Artikel

Clyde & Co fischt Rechtsvorstand bei Helvetia ab

Apollo, Bain Capital und CVC: PE-Bieterrennen um Continental-Tochter Contitech

EY warnt: Equal Pay wird zur Bewährungsprobe

BGH: Jede falsche Umsatzsteuermeldung zählt einzeln

EuGH segnet Vermögenstausch von E.ON und RWE ab

Mehr Themen entdecken

Unsere Partner

Entdecken Sie mit uns bundesweit exklusive Stellen bei:

Entdecken Sie mit uns bundesweit exklusive Stellen bei:

Entdecken Sie mit uns bundesweit exklusive Stellen bei:

Entdecken Sie mit uns bundesweit exklusive Stellen bei:

Entdecken Sie mit uns bundesweit exklusive Stellen bei: