Wayback Machine wird von Verlagen ausgesperrt

blog main image
May 26, 2026
26.05.2026
2 Minuten Lesezeit

Medienhäuser fürchten, dass KI-Firmen über das Webarchiv an ihre Texte kommen. Innerhalb weniger Monate hat sich die Zahl der Blockaden verdoppelt.

Umweg ins Trainingsmaterial

Entwickler von Sprachmodellen brauchen Unmengen an Text. Sie durchkämmen das Internet und nehmen mit, was sie finden. Viele kümmern sich dabei nicht um Verbotsschilder wie die robots.txt. Verlage, die ihre Artikel schützen wollen, stehen vor einem Problem: Selbst wenn sie Crawler aussperren, könnten die Firmen auf ältere Versionen im Internet Archive zurückgreifen. Dieses Hintertürchen schließen nun immer mehr Medienhäuser. Eine Auswertung des Nieman Journalism Lab in Harvard zählt inzwischen über 380 Nachrichtenseiten, die den Archivdienst blockieren. Darunter sind die New York Times, das spanische El País und das französische Le Monde. Aus Deutschland ist bislang niemand dabei.

Lokalpresse macht den Anfang

Die meisten Sperren stammen von Regional- und Lokalzeitungen in den USA. Viele gehören zu einer Handvoll großer Medienketten. Allein seit Jahresbeginn ist die Zahl der Blockaden um mehr als die Hälfte gewachsen. Auch Reddit hat den Dienst bereits weitgehend ausgeschlossen.

Kulturerbe unter Druck

Die Wayback Machine dokumentiert das Netz seit den Neunzigerjahren. Milliarden von Seiten liegen dort gespeichert. Für Historiker, Journalisten und Forscher ist das Archiv unverzichtbar. Jetzt droht es zwischen die Fronten zu geraten. Die Verlage kämpfen eigentlich gegen Tech-Konzerne, doch getroffen wird ein gemeinnütziges Projekt, das das digitale Gedächtnis bewahrt.

Aktuelle Stellenangebote

Meistgelesene Artikel

Unsere Partner

Entdecken Sie mit uns bundesweit exklusive Stellen bei:

Entdecken Sie mit uns bundesweit exklusive Stellen bei:

Entdecken Sie mit uns bundesweit exklusive Stellen bei:

Entdecken Sie mit uns bundesweit exklusive Stellen bei:

Entdecken Sie mit uns bundesweit exklusive Stellen bei: