index tales




		kürzere Version [index tales] ist ein interaktives Netzprojekt, das sich mit der Bedeutung von Suchmaschinen im Internet und deren Rolle als technologische Blackboxes im Prozess von Informationsbewertung und Bedeutungserzeugung beziehungsweise –umdeutung und Wirklichkeitskonstruktion beschäftigt. Im Jahr 1240 ließ der Abt Hugues de Saint-Cher das erste Stichwortverzeichnis der Bibel (also den ersten Index in der Geschichte) aufstellen, um Information leichter navigier- und verfügbar zu machen. Die Bibel hatte in der damaligen Druckfassung etwa 800 Seiten, was heute einem Datenvolumen von rund 5 Megabytes entspricht. Das WorldWideWeb enthält zur Zeit schätzungsweise weit über eine Milliarde Seiten und wächst täglich um einige Millionen weiter. Um diese schiere Informationsflut bewältigen zu können, gibt es Suchmaschinen. Dabei fungieren diese Suchmaschinen als eine Art Eingangstor zu Inhalten im WorldWideWeb, immerhin werden 80 % aller Seiten über diese Suchportale gefunden. Sie übernehmen damit eine entscheidende Rolle bei der Strukturierung und Bewertung von Information im Netz und stellen Umschlagplätze der Aufmerksamkeit von Netznutzern dar. Diese "Ökonomie der Aufmerksamkeit" (Georg Franck) ist ein entscheidender und im alltäglichen Gebrauch oft wenig berücksichtigter Aspekt der Suchmaschinen. Technisch gesehen bestehen alle Suchmaschinen aus drei Teilen: Spiders (auch Crawler oder Robots genannt) sind Programme, die die Aufgabe haben, Seiten im Internet zu durchforsten, indem sie den Links, auf die sie treffen folgen und die angetroffene Information für die Suchmaschine sammeln (man spricht vom Vorgang des Indizierens). Die gesammelten Daten werden im Index, dem Herzstück jeder Suchmaschine eingetragen. Dabei wird eine Bewertung (Ranking) der einzelnen Datensätze (Webseiten) im Bezug auf ihre allgemeine Relevanz durchgeführt, die im Fall der wohl bekanntesten Suchmaschine Google auf dem Algorithmus "PageRank" beruht. Dieser Algorithmus bewertet Seiten einfach gesprochen um so wichtiger, je mehr andere Seiten mit ihr verlinkt sind. Die einzelnen Eintragungen im Index beinhalten mehrere Elemente wie Titel der Seite, den URL oder ein sogenanntes Snippet, einem meist mehrzeiligen Ausschnitt vom Text der Seite. Das dritte Element jeder Suchmaschine stellt schließlich das Suchmaschineninterface dar, mit welchem die Suchanfrage durchgeführt wird. Obwohl nahezu jeder Netzuser regelmäßig Suchmaschinen benützt, wissen die wenigsten um die Funktionsweise dieser Blackbox und die bewertenden Algorithmen dahinter bescheid. Schon der Name "Suchmaschine" suggeriert die absolute Objektivität einer von jeglicher menschlicher Steuerung unabhängigen Maschine und verdeckt so die Prinzipien des Informationsrankings im Hintergrund. Verborgen bleibt, dass Suchmaschinen die (Online-)Welt, die sie vorfinden, nur zu einem gewissen Teil beschreiben, jedoch diese Welt vielmehr – durch Ranking und Kontextualisierung – auch erzeugen und Wirklichkeit konstruieren. Die vermeintlich objektive Liste der Ergebnisse, die wir bei Eingabe eines Suchbegriffes erhalten, ist gemacht, ist ein Produkt eines technologisch-mathematischen Algorithmus, der seinerseit wieder das Produkt technischer Gegebenheiten, wirtschaftlicher Interessen und weltanschaulicher Systeme ist. Suchmaschinen verkörpern das System der Relevanz der Mehrheit beziehungsweise der Popularität, das nur auf den ersten Blick als demokratisch angesehen werden kann (Google bringt auf seiner Website den Slogan: "Democracy on the web works.") Vielmehr handelt es sich um eine Quantififizierung von Qualität und Relevanz durch die Anzahl der Links, die auf eine bestimmte Seite zeigen. Der entscheidende logische Schritt dieses Systems ist die Annahme, dass Seiten, auf die mehr Links zeigen, beliebter und folglich auch besser beziehungsweise relevanter sind, als solche, die weniger oft verlinkt sind. Suchmaschinen wirken auf diese Weise als Trendverstärker, die populäre Sites noch populärer werden lassen und es andererseits weniger bekannten Websites schwierig macht, Bekanntheit zu erlangen. Dieses Prinzip der "Stärkung" von erfolgreichem Content und der Minderbewertung von wenig bekanntem Content lässt sich von der Ebene der Websites auf die Ebene einzelner Wörter herunterbrechen, was das zentrale Thema der Arbeit [index tales] ist. [index tales] bedient sich der Suchmaschine Google, die heute die mit Abstand bedeutendste Suchmaschine im Web darstellt. Genauer verwendet [index tales] die Snippets zu einzelnen Websites in Googles Index, um aus diesen kurzen Textinformationen einzelne Wörter zu entnehmen und diese in neuem Kontext zusammenzusetzen. Dabei verwendet [index tales] einen rekursiven Algorithmus, der ausgehend von einem ersten Begriff entsprechende Treffer von der Suchmaschine Google zurückliefert, davon einige aussucht und dem User zur Wahl anbietet. Der selektierte Begriff wird wieder als neue Suchanfrage verwendet. [index tales] geht davon aus, dass bestimmte Wörter mit hoher Wahrscheinlichkeit dazu passende darauffolgende Wörter aus den Snippets der Suchergebnisse zurückliefern, die somit in einem sprachlichen, kontextuellen oder stilistischen Zusammenhang mit dem Suchbegriff stehen. Damit wird [index tales] selbst zur Engine, die, gespeist durch das informationsökonomische System hinter Google und in Verbindung mit einem eigenen Algorithmus, Satzkonstrukte mit Pseudo-Bedeutung generiert. Pseudo-Bedeutung, die einerseits zu einem gewissen Teil zufallsbedingt ist, andererseits jedoch in großem Maße das Popularitätssystem hinter der Suchmaschine widerspiegelt. Die Sätze, die [index tales] liefert, sprechen eine eigene Sprache. Es ist die Sprache des Index, genauer der Top 100 – die Sprache der ersten 100 Treffer, die Google liefert. Diese jeweils ersten 100 Treffer können als eine Art Querschnitt durch den aktuellen Bedeutungsschatz der Suchmaschine zu einem bestimmten Begriff gesehen werden. Auf jeden Fall spricht [index tales] die Sprache der ersten 100, die Sprache der "100 Fittesten" der fitten Webseiten zum jeweiligen Begriff. Ähnlich, wie bestimmte Webseiten zu einem Suchbegriff höher gerankt werden, weil sie zum Themenbereich dieses Begriffes öfter verlinkt sind, folgen bestimmte Wörter mit höherer Wahrscheinlichkeit auf einen von [index tales] angefragten Suchbegriff als andere, weil sie in diesem Kontext öfter vorkommen. Banale Beispiele für diese Besetzung von Wort- und Bedeutungszusammenhang durch den Algorithmus der Suchmaschine sind die dominante Folge des Wortes "Homepage" auf den Begriff "offizielle" oder des Wortes "Internet" auf die Präposition "im" in den Snippets in Googles Index. Mehrmals machten sich Hacktivisten diese Besetzung der Bedeutung bestimmter Worte durch die Anhäufung entsprechender Links für die Suchmaschine zu Nutzen. Diese Vorgehensweise wird mittlerweile als "Google Bombing" bezeichnet. So gelang es erst kürzlich einer Gruppe von Menschen ausgehend von der Anhäufung von Links auf George W. Bush’s Whitehouse-Bio-Page in diversen Weblogs (das Projekt wurde binnen kürzester Zeit von Weblogs rund um den Globus unterstützt) mit der Bezeichnung "miserable failure", eben diese Homepage des Präsidenten der Vereinigten Staaten als Nr.1-Google-Hit bei der Suche nach dem Begriff "miserable failure" zu etablieren. Dieses Beispiel zeigt gut, wie das informationsökonomische System hinter Google funktioniert und wie schnell Bedeutungen und Kontexte dadurch besetzt und einseitig konnotiert werden können. [index tales] betrachtet die Wörter, die es kreuz und quer aus verschiedenen Snippets zieht als eine Art Pixel. Pixel formen zusammen ein Bild, für sich isoliert sind sie nahezu bedeutungslos. Auch die Wörter, die [index tales] zu neuem Kontext zusammensetzt, sind nicht mehr in ihrem alten Kontext zu erkennen, es sind Pixel, die verschoben wurden. Verschoben aus ihrem ursprünglichen Kontext, hinein in ein System des Google-Kontextes, in ein System der [index tales], wo auf das Wort "das" mit höherer Wahrscheinlichkeit der Begriff "Internet" folgt, als ein anderer. Oder in Pixeln gesprochen, wo neben einem grünen Pixel am öftesten ein gelbes liegt. [index tales] erzählt Märchen aus dem zentralen Index, es plaudert in der Einheitssprache der Top 100 munter vor sich hin und lässt ab und zu einen Blick erhaschen auf etwas, das als das Google-Unbewusste bezeichnet werden könnte. [index tales] zu lauschen kann unterhaltsam, verwirrend, langweilig, überraschend und mitunter sehr aufschlussreich sein.