Was ist die Wayback Machine?

Die Wayback Machine ist ein Internetportal durch das User die Möglichkeit haben auf vorhergehende Fassungen von Internetseiten zurückzugreifen. Die US-amerikanische gemeinnützige Organisation Internet Archive ist Betreiber des Portals. In gleichmässigen Intervallen sichert die Wayback Machine Content unterschiedlicher Webseiten und erstellt auf diese Weise eine Historie mit verschiedenen Versionen und Gegebenheiten. Dadurch bevorratet das Portal auch massenhaft Daten. Das Portal ist auch aufgrund verschiedener Zuwiderhandlungen gegen gültiges Copyright stark in die Kritik geraten.

Das computerisierte Archiv Wayback Machine wurde entwickelt um das Internet so wiederzugeben, wie es früher war. Dies ist jedoch zugleich der Grund, warum das Portal kritisiert wird. Gemäss Land und gültigen Gesetzen verletzt der Betreiber mittels umfangreicher Datenspeicherung das Copyright bzw. Urheberrecht.

Anwendungsbereiche

Der Hauptzweck der Wayback Machine besteht darin, Forschern, Wissenschaftlern und Historikern den Zugriff auf digitale Archive möglich zu machen. Aus diesem Grund sammelt Internet Archive nicht nur Daten, mithilfe von Crawlern, von aufbewahrten Internetseiten, sondern auch Text, Audios, bewegte Bilder und Software. Auf diese Weise werden Websites mit all ihren Inhalten gesichert.

Die Organisation Internet Archive nutzt die Datenbank des Online-Unternehmens Alexa, einem Subunternehmen von Amazon, das global Besuchsdaten von Internetseiten zusammenträgt.

Einwände & Kritik zur Wayback Machine

Die umfangreiche Speicherung von Websites und ihrem Inhalt ist strittig. Gemäss gültiger Gesetze kann es während der Speicherung zu Urheberrechtsverletzungen kommen, da der genutzte Crawler indiziert und erst einmal alle Websites und Inhalte aufnimmt. Insbesondere in Bezug auf die rechtliche Situation in Deutschland ist die Aufbewahrung eine Reproduktion eines urheberrechtlich geschützten Werks und verletzt daher das Copyright.

Um die gespeicherten Daten löschen zu lassen, müssen Website-Betreiber eine Anfrage an die Organisation senden. Trotzdem ist der Inhalt nach wie vor in Datenbank vorhanden, auch wenn der Löschung der Internetseite zugestimmt wurde. Dies ist eine besondere Herausforderung für Foren und soziale Netzwerke, da User ihre Posts nicht löschen können, auch wenn diese nichts mehr mit der Aktualität gemein haben.

Mittels der geeigneten Konfiguration der robots.txt-Datei probieren einige Website-Betreiber sich zu schützen. In dieser Datei wird festgelegt, welche Seitenbereiche indiziert werden sollen und welche nicht, um damit Suchmaschinen in ihrer Arbeit zu unterstützen. Der Inhaber der Wayback Machine hat allerdings im April 2017 verlauten lassen, dass der Crawler künftig nur noch in geringem Mass die Konfiguration der robots.txt-Datei berücksichtigen wird, um der eigenen Unternehmensphilosophie einer realistischen Darstellung des Internets nachzukommen. Internet Archive indiziert und speichert auch Webseiten der US-amerikanische Regierung, auch wenn dies durch die robots-txt-Datei versagt ist.

SEO kann profitieren

Bei der professionellen Suchmaschinenoptimierung (SEO) kann die Wayback Machine jedoch von Vorteil sein: Wenn der PageRank in der SERP aufgrund unfairer Methoden geahndet wird, können Website-Betreiber den Vergleich des Quellcodes mit vorherigen Versionen der Seite anstellen, um damit den Grund für die Ahndung besser zu verstehen. Zusätzlich erleichtert es auch das Erkennen und Verbessern anderer Fehler.

Bezüglich des Linkmanagements kann das Zurückgreifen auf vorangegangene Versionen und Gegebenheiten auch nützlich sein. Mangelhafte und tote Links lassen sich einfacher feststellen. Auch bei Duplicate Content bietet sich für den Webseiteninhaber Chance auf die ältere gespeicherte Version als Beweis für die Abstammung hinzuweisen.

Teilen Sie diesen Beitrag in Ihren Netzwerken