kürzere Version
[index tales] ist ein interaktives Netzprojekt, das sich mit der
Bedeutung von Suchmaschinen im Internet und deren Rolle als technologische
Blackboxes im Prozess von Informationsbewertung und Bedeutungserzeugung
beziehungsweise –umdeutung und Wirklichkeitskonstruktion beschäftigt.
Im Jahr 1240 ließ der Abt Hugues de Saint-Cher das erste
Stichwortverzeichnis der Bibel (also den ersten Index in der Geschichte)
aufstellen, um Information leichter navigier- und verfügbar
zu machen. Die Bibel hatte in der damaligen Druckfassung etwa 800
Seiten, was heute einem Datenvolumen von rund 5 Megabytes entspricht.
Das WorldWideWeb enthält zur Zeit schätzungsweise weit
über eine Milliarde Seiten und wächst täglich um
einige Millionen weiter.
Um diese schiere Informationsflut bewältigen zu können,
gibt es Suchmaschinen.
Dabei fungieren diese Suchmaschinen als eine Art Eingangstor zu
Inhalten im WorldWideWeb, immerhin werden 80 % aller Seiten über
diese Suchportale gefunden. Sie übernehmen damit eine entscheidende
Rolle bei der Strukturierung und Bewertung von Information im Netz
und stellen Umschlagplätze der Aufmerksamkeit von Netznutzern
dar.
Diese "Ökonomie der Aufmerksamkeit" (Georg Franck)
ist ein entscheidender und im alltäglichen Gebrauch oft wenig
berücksichtigter Aspekt der Suchmaschinen.
Technisch gesehen bestehen alle Suchmaschinen aus drei Teilen:
Spiders (auch Crawler oder Robots genannt) sind Programme, die die
Aufgabe haben, Seiten im Internet zu durchforsten, indem sie den
Links, auf die sie treffen folgen und die angetroffene Information
für die Suchmaschine sammeln (man spricht vom Vorgang des Indizierens).
Die gesammelten Daten werden im Index, dem Herzstück jeder
Suchmaschine eingetragen. Dabei wird eine Bewertung (Ranking) der
einzelnen Datensätze (Webseiten) im Bezug auf ihre allgemeine
Relevanz durchgeführt, die im Fall der wohl bekanntesten Suchmaschine
Google auf dem Algorithmus "PageRank" beruht.
Dieser Algorithmus bewertet Seiten einfach gesprochen um so wichtiger,
je mehr andere Seiten mit ihr verlinkt sind.
Die einzelnen Eintragungen im Index beinhalten mehrere Elemente
wie Titel der Seite, den URL oder ein sogenanntes Snippet, einem
meist mehrzeiligen Ausschnitt vom Text der Seite.
Das dritte Element jeder Suchmaschine stellt schließlich das
Suchmaschineninterface dar, mit welchem die Suchanfrage durchgeführt
wird.
Obwohl nahezu jeder Netzuser regelmäßig Suchmaschinen
benützt, wissen die wenigsten um die Funktionsweise dieser
Blackbox und die bewertenden Algorithmen dahinter bescheid.
Schon der Name "Suchmaschine" suggeriert die absolute
Objektivität einer von jeglicher menschlicher Steuerung unabhängigen
Maschine und verdeckt so die Prinzipien des Informationsrankings
im Hintergrund.
Verborgen bleibt, dass Suchmaschinen die (Online-)Welt, die sie
vorfinden, nur zu einem gewissen Teil beschreiben, jedoch diese
Welt vielmehr – durch Ranking und Kontextualisierung –
auch erzeugen und Wirklichkeit konstruieren.
Die vermeintlich objektive Liste der Ergebnisse, die wir bei Eingabe
eines Suchbegriffes erhalten, ist gemacht, ist ein Produkt eines
technologisch-mathematischen Algorithmus, der seinerseit wieder
das Produkt technischer Gegebenheiten, wirtschaftlicher Interessen
und weltanschaulicher Systeme ist.
Suchmaschinen verkörpern das System der Relevanz der Mehrheit
beziehungsweise der Popularität, das nur auf den ersten Blick
als demokratisch angesehen werden kann (Google bringt auf seiner
Website den Slogan: "Democracy on the web works.")
Vielmehr handelt es sich um eine Quantififizierung von Qualität
und Relevanz durch die Anzahl der Links, die auf eine bestimmte
Seite zeigen.
Der entscheidende logische Schritt dieses Systems ist die Annahme,
dass Seiten, auf die mehr Links zeigen, beliebter und folglich auch
besser beziehungsweise relevanter sind, als solche, die weniger
oft verlinkt sind. Suchmaschinen wirken auf diese Weise als Trendverstärker,
die populäre Sites noch populärer werden lassen und es
andererseits weniger bekannten Websites schwierig macht, Bekanntheit
zu erlangen.
Dieses Prinzip der "Stärkung" von erfolgreichem
Content und der Minderbewertung von wenig bekanntem Content lässt
sich von der Ebene der Websites auf die Ebene einzelner Wörter
herunterbrechen, was das zentrale Thema der Arbeit [index tales]
ist.
[index tales] bedient sich der Suchmaschine Google, die heute die
mit Abstand bedeutendste Suchmaschine im Web darstellt.
Genauer verwendet [index tales] die Snippets zu einzelnen Websites
in Googles Index, um aus diesen kurzen Textinformationen einzelne
Wörter zu entnehmen und diese in neuem Kontext zusammenzusetzen.
Dabei verwendet [index tales] einen rekursiven Algorithmus, der
ausgehend von einem ersten Begriff entsprechende Treffer von der
Suchmaschine Google zurückliefert, davon einige aussucht und
dem User zur Wahl anbietet. Der selektierte Begriff wird wieder
als neue Suchanfrage verwendet.
[index tales] geht davon aus, dass bestimmte Wörter mit hoher
Wahrscheinlichkeit dazu passende darauffolgende Wörter aus
den Snippets der Suchergebnisse zurückliefern, die somit in
einem sprachlichen, kontextuellen oder stilistischen Zusammenhang
mit dem Suchbegriff stehen.
Damit wird [index tales] selbst zur Engine, die, gespeist durch
das informationsökonomische System hinter Google und in Verbindung
mit einem eigenen Algorithmus, Satzkonstrukte mit Pseudo-Bedeutung
generiert.
Pseudo-Bedeutung, die einerseits zu einem gewissen Teil zufallsbedingt
ist, andererseits jedoch in großem Maße das Popularitätssystem
hinter der Suchmaschine widerspiegelt.
Die Sätze, die [index tales] liefert, sprechen eine eigene
Sprache. Es ist die Sprache des Index, genauer der Top 100 –
die Sprache der ersten 100 Treffer, die Google liefert.
Diese jeweils ersten 100 Treffer können als eine Art Querschnitt
durch den aktuellen Bedeutungsschatz der Suchmaschine zu einem bestimmten
Begriff gesehen werden.
Auf jeden Fall spricht [index tales] die Sprache der ersten 100,
die Sprache der "100 Fittesten" der fitten Webseiten zum
jeweiligen Begriff.
Ähnlich, wie bestimmte Webseiten zu einem Suchbegriff höher
gerankt werden, weil sie zum Themenbereich dieses Begriffes öfter
verlinkt sind, folgen bestimmte Wörter mit höherer Wahrscheinlichkeit
auf einen von [index tales] angefragten Suchbegriff als andere,
weil sie in diesem Kontext öfter vorkommen.
Banale Beispiele für diese Besetzung von Wort- und Bedeutungszusammenhang
durch den Algorithmus der Suchmaschine sind die dominante Folge
des Wortes "Homepage" auf den Begriff "offizielle"
oder des Wortes "Internet" auf die Präposition "im"
in den Snippets in Googles Index.
Mehrmals machten sich Hacktivisten diese Besetzung der Bedeutung
bestimmter Worte durch die Anhäufung entsprechender Links für
die Suchmaschine zu Nutzen. Diese Vorgehensweise wird mittlerweile
als "Google Bombing" bezeichnet.
So gelang es erst kürzlich einer Gruppe von Menschen ausgehend
von der Anhäufung von Links auf George W. Bush’s Whitehouse-Bio-Page
in diversen Weblogs (das Projekt wurde binnen kürzester Zeit
von Weblogs rund um den Globus unterstützt) mit der Bezeichnung
"miserable failure", eben diese Homepage des Präsidenten
der Vereinigten Staaten als Nr.1-Google-Hit bei der Suche nach dem
Begriff "miserable failure" zu etablieren.
Dieses Beispiel zeigt gut, wie das informationsökonomische
System hinter Google funktioniert und wie schnell Bedeutungen und
Kontexte dadurch besetzt und einseitig konnotiert werden können.
[index tales] betrachtet die Wörter, die es kreuz und quer
aus verschiedenen Snippets zieht als eine Art Pixel.
Pixel formen zusammen ein Bild, für sich isoliert sind sie
nahezu bedeutungslos. Auch die Wörter, die [index tales] zu
neuem Kontext zusammensetzt, sind nicht mehr in ihrem alten Kontext
zu erkennen, es sind Pixel, die verschoben wurden. Verschoben aus
ihrem ursprünglichen Kontext, hinein in ein System des Google-Kontextes,
in ein System der [index tales], wo auf das Wort "das"
mit höherer Wahrscheinlichkeit der Begriff "Internet"
folgt, als ein anderer. Oder in Pixeln gesprochen, wo neben einem
grünen Pixel am öftesten ein gelbes liegt.
[index tales] erzählt Märchen aus dem zentralen Index,
es plaudert in der Einheitssprache der Top 100 munter vor sich hin
und lässt ab und zu einen Blick erhaschen auf etwas, das als
das Google-Unbewusste bezeichnet werden könnte.
[index tales] zu lauschen kann unterhaltsam, verwirrend, langweilig,
überraschend und mitunter sehr aufschlussreich sein.
|