Direkt zum Inhalt

Das Netz wird Geschichte: Neuer Trend zu Online-Archiven


09. Juni 2015, 10:19
PRESSEMITTEILUNG/PRESS RELEASE

Kennen Sie noch die AOL-CDs? In den späten 1990ern fielen Sie den Lesern aus fast jeder Zeitschrift unversehens in die Hände. Und von dort oft rasch weiter in den Papierkorb. Wie schade! Nicht nur, weil man damals damit „10 Stunden kostenlos“ ins Internet konnte, sondern auch, weil die Silberlinge heute gesuchte Zeugen der frühen Internet-Geschichte sind. (1) „Yes, I Want Your Goddamn AOL CDs“ (2) ruft uns Internet-Archivar Jason Scott in seinem Blog entgegen. Er sammelt für das Internet-Archiv (3) quasi alles, was die Geschichte des Internets bis heute beleuchtet, von ollen 1,44-Megabyte-Floppys bis zu, tja, eben AOL CDs: „Wenn Sie mir etwas Zeit sparen wollen, kopieren Sie sie in eine ISO-Datei und scannen Sie die Hülle, in der Sie sie bekommen haben und die Vorderseite der CD. Und wenn nicht, schicken Sie sie einfach so“, bittet Scott den Rest der Welt.

Das Gedächtnis des Web
Das Internet Archive (3) ist sozusagen das Gedächtnis des World Wide Web. Während das weltweite Netz mit IPv6 und dem Internet der Dinge quasi in die 4. Generation geht und sich Jugendliche fragen, wie der Mensch es vor 25 Jahren überhaupt geschafft hat, ohne Internet seinen Alltag zu meistern, wächst verständlicherweise das Interesse an der Online-Historie. Soeben wurde das Design der Archiv-Startseite neu und zeitgemäß gestaltet, um den Wünschen eines wachsenden Publikums besser gerecht zu werden. Faszinierender – oder erschreckender – Weise finden sich darin alle Sünden und Heldentaten, die wir seit den späten 90er Jahren auf unseren Homepages ausprobiert haben. Wer es nicht glaubt, kann dort einfach die Adresse seiner früheren oder heutigen Homepage eingeben, und die Schnappschüsse längst vergessen geglaubter Web-Experimente begutachten. Aber das ist nicht alles. Auch 2.400 Spieleklassiker, die unter dem längst vergessenen MS DOS liefen, wurden archiviert, wieder im Web veröffentlicht und lassen sich nun sogar direkt auf Twitter spielen. (5)

Größtes Online-Archiv: das Usenet
Daneben gibt es jede Menge privat geführter Online-Archive und -Gedenkstätten, vom berühmten Wikileaks bis zur Website einer in den 1970ern gegründeten Sekte, deren Mitglieder sich 1997 kollektiv das Leben nahmen (6). Mengenmäßig ist das größte Archiv wohl das Usenet: Bereits mehr als 10 Petabyte (PB) umfasst es nach Expertenschätzungen Stand heute, das sind 10.000.000.000.000.000 Bytes, und jeden Tag kommen durchschnittlich 10 Terabyte (TB) hinzu. Auf den meisten Newsservern werden Artikel ab einem gewissen Alter zwar gelöscht. Da ältere Artikel trotzdem von Interesse sein können, gab es stets Bemühungen, sie zu archivieren. Die Datenbestände wurden von Google aufgekauft und unter dem Namen Google Groups als Suchdienstleistung angeboten. (7) Der älteste Artikel hier ist vom 11. Mai 1981. (8) Lücken im Bestand von Google Groups ergeben sich, wenn Postings mit dem Header X-No-Archive:Yes versehen waren oder wenn sie vom Absender aus dem Archiv gelöscht worden sind. Der allerälteste, uns bekannte Usenet-Artikel ist jedoch vom 27. Mai 1980 und findet sich auf der Seite eines pensionierten Universitätsangestellten. (9)

Vorhalte-Dauer für ältere Dateien steigt
Ein Großteil der Datenmassen des Usenet-Archivs besteht jedoch nicht aus den relativ kleinen Text- und HTML-Dateien, sondern aus Binärdateien, den sogenannten Usenet-Binaries: also allem, was kein reiner Text ist. Auf rund 10.000 Usenet-Servern weltweit verteilt liegen über 500 Mio. Dateien. Wie weit die Archive in die Geschichte zurückreichen, ist sehr unterschiedlich. Der Provider UseNeXT hält im Moment Dateien der letzten 2013 Tage vor, das sind umgerechnet die letzten fünfeinhalb Jahre. Angesichts der Datenmengen ist das für einen Usenet-Provider viel, vor allem, wenn man einbezieht, dass diese so genannte Retention Zeit 2006 gerade mal bei 70 und 2011 bei 1111 Tagen lag. (10) Wie im Internet übernehmen heute private (Usenet-)Provider die massenhafte Speicherung und den Transport der Dateien, nicht mehr staatliche Institutionen und Universitäten, wie in der Frühzeit des Usenet wie auch des World Wide Web. Die meisten arbeiten mit einem zeitgemäßen Freemium-Modell, bieten also einen begrenzten kostenlosen Zugang, wer aber dauerhaft und schnell auf Dateien zugreifen will, zahlt in der Regel eine monatliche Pauschale. Wer das Usenet mit dem seit zehn Jahren erprobten deutschen Provider UseNeXT (11) kennenlernen will, dem bietet UseNeXT seinen Usenet-Zugang 14 Tage gratis zum Testen an, inklusive 300GB kostenlosem Traffic. In Europa ist UseNeXT einer der führenden Anbieter in diesem Bereich. Einen Monat Usenet können Interessierte hier bereits ab 9,95 Euro buchen. Der Pauschalpreis enthält eine Flatrate zum Surfen im Usenet, ein Trafficvolumen von 30GB bei Übertragung mit voller Bandbreite und darüber hinaus ein unbegrenztes Volumen mit einer Zugangsgeschwindigkeit von bis zu 2.000 kBit/s.

Zum letzten Mal: Die Vermessung der Welt
Alle Bemühungen, Schnappschüsse der digitalen Welt für die Nachgeborenen festzuhalten, sind jedoch zur Lückenhaftigkeit verurteilt. Lässt sich die Größe des Usenet bereits jetzt nur noch näherungsweise schätzen, konnte das Internet 2012 digital vermessen werden – und das gleichzeitig zum dritten Mal nach dem sogenannten IPv4-Census 2006 (12) und dem Internet Scan von HD Moore (13) - und wahrscheinlich zum letzten Mal überhaupt in der Geschichte. Ein Hacker unter dem nom de guerre „Carna“ schuf ein temporäres weltweites Botnetz aus illegal gehackten Routern und Rechnern, mit dessen Hilfe es ihm gelang, die Welt des Internet zu vermessen, zu speichern und zusammen mit dem Rohmaterial in einer umfassenden Studie zu veröffentlichen. (13) Ein Auszug aus dem Ergebnis: Das Internet bestand 2012 aus rund 1,3 Milliarden weltweit in Gebrauch befindlichen IP-Adressen. Die Einführung des Nachfolgeprotokolls IPv6, das bereits gerüstet ist für das Internet der Dinge, erhöht jedoch die Zahl der verfügbaren Adressen so stark, dass ähnliche Scans zukünftig kaum mehr möglich sein werden. Ein Gesamtarchiv aller Online-Inhalte wird damit noch weniger möglich sein als heute.

(1)http://thenextweb.com/shareables/2015/05/20/10-free-hours-online/
(2)http://ascii.textfiles.com/archives/4624
(3)https://archive.org/index.php?&ui3=1
(4)http://gizmodo.com/the-internet-archive-has-grown-up-with-a-gorgeous-ne…
(5)http://www.golem.de/news/internet-archive-md-dos-spiele-direkt-auf-twit…
(6)http://thenextweb.com/shareables/2015/04/30/the-gate-is-closed/
(7)http://de.wikipedia.org/wiki/Usenet
(8)https://groups.google.com/forum/#!msg/net.general/yJn8WHlzc7U/lPyVdYqCX…
(9)http://shikan.org/bjones/Usenet.Hist/Nethist/0061.html
(10)http://www.usenext.de/usenet-infos/retention-time/
(11)http://www.usenext.de
(12)http://www.isi.edu/~johnh/PAPERS/Heidemann07c.pdf
(13)https://speakerdeck.com/hdm/derbycon-2012-the-wild-west
(14)http://internetcensus2012.bitbucket.org/paper.html

Kontakt