# taz.de -- 10 Jahre Wikipedia: Wie das Wissen System bekommt
       
       > Wikipedia ist nicht nur ein Nachschlagewerk, sondern auch eine Datenbank
       > der Informationen. Mit semantischen Techniken versuchen Forscher den
       > Wissensschatz zu heben.
       
 (IMG) Bild: Wissen im Auge des Betrachters: Wikipedia.
       
       Wie viele Flüsse gibt es in Europa? Wie viele deutsche Städte werden von
       Bürgermeisterinnen regiert? Es gibt Fragen, die selbst die
       Online-Enzyklopädie [1][Wikipedia] nicht beantworten kann. In den letzten
       zehn Jahren hat ein Heer von Freiwilligen Informationen zu fast allem
       gesammelt – von Politiker-Biografien über technische Standards bis hin zu
       detaillierten Beschreibungen der Figuren in der Fernsehserie "Die
       Simpsons".
       
       Seit 2007 versuchen Mitarbeiter der Universität Leipzig, der Freien
       Universität Berlin und des US-Unternehmens OpenLink Software Ordnung in das
       Wirrwarr zu bringen. Mit dem Projekt DBpedia extrahieren sie das
       Faktenwissen aus dem Freiwilligen-Projekt und speisen es in eine gewaltige
       Datenbank.
       
       Mehr als eine Milliarde Informationen haben sie in den letzten drei Jahren
       zusammengetragen und aufbereitet: Wer wurde wann geboren? In welcher Stadt?
       Wie viele Einwohner wohnen in dieser Stadt? Und welcher Fluss fließt durch
       diese Stadt? Fakten, die in unzähligen verschiedenen Wikipedia-Artikeln
       zerstreut sind, werden bei DBPedia neu verbunden.
       
       "Es ist sehr nützlich, wenn man auf die Fakten direkt zugreifen kann und
       sie nicht erst aus dem Text heraussuchen muss", erklärt Dr. Sören Auer von
       der Universität Leipzig. Mit der DBPedia wollten die Forscher zeigen, wie
       viele Informationen in der Wikipedia stecken und wie man sie besser
       verknüpfen kann.
       
       Computer lesen genau 
       
       Während sich die unzähligen freiwilligen Autoren der Wikipedia in den
       umstrittenen Artikeln um jede Formulierung feilschen und regelrechte
       Editierkriege führen, interessieren sich die Forscher für das reine
       Faktenwissen. Eine Quelle sind die Info-Boxen, die in den vergangenen
       Jahren in immer mehr Artikeln auftauchen.
       
       Hier verzeichnen die Autoren Einwohnerzahlen, Geburtsdaten,
       Erscheinungsdaten - jeder Fachbereich hat seine eigenen Infoboxen. Die
       Qualität der Daten sei in der Regel sehr gut. "Manchmal gibt es Probleme,
       wenn zum Beispiel in einer Infobox eine Einheit fehlt", erklärt Auer. Das
       Problem: anders als menschliche Leser kann die Datenbank solche formalen
       Inkonsistenzen nicht selbständig korrigieren.
       
       DBpedia soll aber nicht nur eine bessere Suchfunktion für Wikipedia
       liefern. Richtig spannend werden die Datensätze, wenn sie mit anderen
       Datenquellen kombiniert werden. So nutzt die BBC die DBPedia, um ihr
       Fernsehprogramm mit Informationen anzureichern. Auch der Nachrichtenkonzern
       Thomson Reuters nutzt die freie Datenbank schon, um seine Meldungen
       aufzupeppen. "DBpedia soll zu einem Kristallisationepunkt werden", sagt
       Auer. Mit der Datenmacht der Wikipedia soll das "Semantic Web", das Netz
       der Datenbanken vorangetrieben werden.
       
       Vom Nachschlagewerk zur Antwortmaschine 
       
       Das semantische Netz ist seit über einem Jahrzehnt eines der
       Lieblingsprojekte von Web-Pionieren wie Tim Berners-Lee, dem Begründer des
       World Wide Web: möglichst viele Informationen im Netz sollen
       maschinenlesbar aufbereitet werden, um den Menschen wieder mehr Kontrolle
       über die gewaltigen Datenmengen im Netz zu geben.
       
       Auch Wikipedianer sind von der Idee fasziniert. "Wikipedia ist heute noch
       an viel zu vielen Stellen an Kompromisse der Print-Zeit gebunden", sagt
       Mathias Schindler, Projektmanager beim Verein Wikimedia Deutschland. Zum
       Beispiel wird das Wissen bei Wikipedia immer noch in einzelne Artikel
       aufgeteilt. Mit Hilfe semantischer Techniken könnte die Online-Enzyklopädie
       in eine Art Frage- Antwort-Maschine verwandelt werden, die dem Leser
       zielgenau die Informationen liefert, die er braucht.
       
       Mit dem Projekt [2][Semantic MediaWiki] soll die Wikipedia selbst mehr in
       eine Datenbank verwandelt werden - zudem könnte die Wikipedia automatisch
       andere Datenquellen wie die offiziellen Einwohnerzahlen einer Stadt
       automatisch integrieren. Ob und wann das Projekt jedoch in die Wikipedia
       integriert wird, steht noch nicht fest. Dass die Datenbankabfragen
       Wikipedia-Artikel komplett ersetzen, ist nicht zu befürchten: das Vokabular
       der Datenbanken ist noch zu grob, die Wirklichkeit zu vielfältig und
       uneindeutig, um sie in ein rigides Datenmuster zu pressen.
       
       14 Jan 2011
       
       ## LINKS
       
 (DIR) [1] http://de.wikipedia.org
 (DIR) [2] http://www.semantic-mediawiki.org
       
       ## AUTOREN
       
 (DIR) Torsten Kleinz
       
       ## TAGS
       
 (DIR) Internet
       
       ## ARTIKEL ZUM THEMA
       
 (DIR) Kolumne Nullen und Einsen: Der vergessene Gopherspace
       
       Alle feiern den 25. Geburtstag des World Wide Web, denn den Gewinnern der
       Geschichte gratuliert man gerne. Und was ist mit den Verlierern?
       
 (DIR) Wikipedia überaltert: Wissen ohne Nachwuchs
       
       Das Wissen der Welt soll gesammelt werden, aber sammeln tun nur wenige:
       Wikipedia hat ein Nachwuchsproblem. Langjährige Autoren machen Neulingen
       teilweise das Leben schwer.
       
 (DIR) Streit auf Wikipedia: Geguttenbergte Werke
       
       Plagiat oder Remix? Was im Fall Guttenberg zum Politikum wurde, sorgt in
       der Online-Enzyklopädie Wikipedia immer wieder für Streit. Nun hat ein
       Buchautor Strafanzeige gestellt.
       
 (DIR) Frauenquote bei Wikipedia: Wissen für alle, aber nur von Männern
       
       3,5 Millionen Artikel in 250 Sprachen - Wikipedia hat viel erreicht in zehn
       Jahren. Allerdings ohne Frauen. Nur 13 Prozent der aktiv Schreibenden sind
       weiblich. Das soll sich ändern.
       
 (DIR) Misstrauensvotum gegen Wikimedia-Vorstand: Konzern oder Community?
       
       Stress in Wikiland. Der Vorstand von Wikimedia Deutschland steht in der
       Kritik. Auslöser ist die Gründung einer Tochtergesellschaft für die
       Spendenverwaltung.
       
 (DIR) Kommentar 10 Jahre Wikipedia: Kostenlos und ohne Werbung
       
       Das Online-Lexikon Wikipedia zeigt, dass es sehr wohl funktionieren kann,
       auf das Wissen und die Intelligenz der Web-User zusetzen.
       
 (DIR) Ringen um einen Lexikon-Eintrag: Wer bestimmt das Wikipedia-Wissen?
       
       Der Wikipedia-Artikel über den „Neoliberalismus“ ist einer der
       umkämpftesten in der Online-Enzyklopädie. Es wird ergänzt, geändert und
       geätzt. Mitten im Edit War: ein Lokalpolitiker von der FDP
       
 (DIR) Wikipedia sammelt Spenden: "In your face, brockhaus!"
       
       Kurz vorm 10. Geburtstag hat die Wikipedia ihren jährlichen Spendenaufruf
       beendet. 12 Millionen Euro kamen zusammen. Was passiert jetzt mit dem Geld?
       
 (DIR) 10 Jahre Wikipedia: "Triumphgeheul wäre fehl am Platz"
       
       Pavel Richter ist Geschäftsführer des Fördervereins Wikimedia Deutschland.
       Im Interview spricht er über Technikprobleme, Betriebsblindheit und die
       Macht des Wissens.