Fakultät Wirtschaftsinformatik und Angewandte Informatik

Lehrstuhl für Angewandte Informatik in den Kultur-, Geschichts- und Geowissenschaften

WikiSemantik

Semantikanalyse in semi-strukturierten Wiki Texten

Hintergrund

  • Im Gegensatz zu klassischen Datenbanken beinhalten Wikis un- oder semi-strukturierte Texte. Strukturelemente sind hierbei
    • interne Links (Verbindung von Link-Anker und Link-Ziel)
    • Überschriften, Listen und andere Textauszeichnungen
    • Felder in Templates (Info-Boxen)
  • Zudem existieren diverse Semantic-Wiki-Engines (http://semanticweb.org/wiki/Semantic_wiki_projects), deren bekannteste wohl die Semantic MediaWiki Extension ist.
  • Die einzelnen Strukturelemente machen Wiki-Texte (vor allem die Infoboxen) machen die Wiki-Inhalte einer semantischen Analyse durchaus zugänglich, weit besser natürlich bei Nutzung einer Semantic Wiki Extension.
  • Der Wiki Explorator beschränkt sich bislang vollständig auf die Analyse der Netzwerkstruktur und nutzt Textinhalte nicht.

Kurzbeschreibung

  • Erweiterung des Wiki Explorator um Textanalysefunktionen auf Basis obigen Strukturelemente, insbesondere Templates/Infoboxen
  • Anpassung für die Nutzung auf Semantic Mediawiki Daten
  • Entwicklung von Analysemethoden und Visualisierung zur Nutzung und Auswertung dieser semantischen Informationen.
  • Hierbei jeweils Integration der vorhandenen (Netzwerk-)Strukturinformationen

Voraussetzungen

  • Ruby-Kenntnisse (oder schnelles Lernen)
  • Interesse an semantischer Analyse/Textanalyse