Erstellt am: 15. 10. 2012 - 16:26 Uhr
Mit Omnipedia wird Wikipedia vergleichbar
Aus dem Alltag ist die Mitmachenzyklopädie Wikipedia nicht mehr wegzudenken. In mehr als 280 Sprachen gibt es das kollaborativ erzeugte Lexikon. Von Albanisch über Latein bis hin zu Chinesisch. Die meisten Artikel werden dabei nicht einfach von einer Sprache in die anderer übersetzt, sondern völlig neu geschrieben. Und jeder, der mindestens zweier Sprachen mächtig ist, hat schon festgestellt, wie unterschiedlich zwei Artikel zum selben Thema ausfallen. Nicht nur was die Länge und Ausführlichkeit anbelangt, sondern auch der Inhalt.
Gerüchte sind kulturspezifisch
Liest man in der deutschen Wikipedia den Eintrag über Verschwörungstheorien, findet man darin eine Reihe berühmter Beispiele aufgelistet. Von anti-jesuitischen Verschwörungstheorien über das Kennedy Attentat bis hin zu den Terroranschlägen vom 11. September reicht das Spektrum. Von den wilden Theorien, die um die Computerfirma Microsoft gesponnen werden, erfährt man nichts. Dazu müsste man des Hebräischen mächtig sein. Denn in der hebräischen Version findet man das Gerücht, dass Microsoft in seine Software absichtlich Fehler eingebaut hat, damit der amerikanische Geheimdienst auf fremde PCs zugreifen kann.
Omnipedia
…aber auch Kaffee
Jede der bisher fast dreihundert Wikipedia Editionen enthält zu einem Thema ganz spezifische Informationen, sagt Brent Hecht. Er ist Doktorand für Computerwissenschaft an der Northwestern University und einer der Väter von Omnipedia. Selbst wenn man zehn Sprachen beherrscht, gehen einem doch noch viele relevante Informationen verloren. Gemeinsam mit seinem Team hat Brent Hecht einen komplizierten Algorithmus entworfen, der Wikipediaeinträge zum selben Thema miteinander vergleicht. Bei großen allgemeinen Begriffen wie Schokolade oder Koffein weichen die Artikel stark voneinander ab, meint der Computerwissenschaftler. "Da spielt der kulturelle Background so stark mit. Bei Kaffee denke ich als Amerikaner als erstes an Starbucks. Als Österreicher denkt man wahrscheinlich eher an ein schönes altes Kaffeehaus."
Ausgeklügelte Grafik
Die Darstellung der Resultate des Vergleichs ist gefinkelt. Jedes Schlagwort in einem Artikel wird als kleiner Kreis dargestellt. Beim Eintrag über Kaffee sind es unter anderem die Worte Heißgetränk, osmanisches Reich und Steinfrucht. Kommt ein Schlagwort nur ein einer Sprache vor, ist der Kreis einfarbig. Türkis steht etwa für Französisch, gelb für Deutsch und aquamarinblau für Englisch. Kommt ein Schlagwort in mehreren Sprachversionen vor, ist er in verschiedenfarbige Segmente gesplittet.
Noch im Forschungsstadium
Einträge über Orte finden sich hauptsächlich in der Sprache, die an jenem Ort gesprochen wird. Ein kleines österreichisches Dorf wird wahrscheinlich nur in der deutschen Wikipedia vorkommen, sagt Hecht. "Das muss aber nicht sein. Ich komme aus einer kleinen Stadt in Kalifornien. Den Eintrag dazu gibt es auch in der deutschen Ausgabe. Die deutsche Ausgabe erwähnt berühmte Persönlichkeiten aus meiner Stadt, die in der englischen fehlen. Die deutsche Wikipedia enthält im Allgemeinen sehr viele Geburtsorte von Personen. Ich habe also einiges über mein winzig kleines 'Dorf' erfahren."
Die Übersetzung übernimmt der entsprechende Dienst der Suchmaschine Bing. Noch ist die Omnipedia ein Forschungsprojekt und steht nur Testusern offen. Doch in ein paar Monaten wollen Brent Hecht und sein Team das Online-Tool als Open Source veröffentlichen.