Semantische Suchdienste in der Betaphase

Ein beliebtes Beispiel um Suchmaschinen zu testen, ist der Begriff „Golf“.

Damit kann eine Sportart, eine Automarke, ein Golfball, eine größere Meeresbucht oder ein Programmierwettbewerb gemeint sein. Der klassische Suchdienst „Google“ unterscheidet auf der ersten Ergebnisseite Golf als Sportart und Golf als VW Automarke. „Yahoo“ liefert bessere Ergebnisse und kategorisiert mit Autovervollständigungsfunktion in fünf verschiedene Kategorien: Golfschläger, Golf Deutschland, VW Golf, Golfreisen und Golfurlaub.

Im Vergleich dazu liefert die Suche nach dem Schlagwort „Golf“ in der semantischen Suchmaschine cuil.com folgendes Bild:

Die Ergebnisse sind in der oberen linken Leiste, in den Tabs kategorisiert nach: „All results“, „Golf Equipment“, „Golf Balls“, „VW Golf“, unter der Kategorie „more“ kommen Vorschläge zu Golfreisen sowie weitere Kategorien. Die Ergebnisse sind in Webdokumente und Videos unterteilt. Rechts ist auf jeder Unterseite Suche nach verschiedenen verwandten Kategorien möglich. Bei Auswahl eines Schlagwortes kommen weitere, assoziierte Schlagworte auf, wiederum in Kategorien geordnet. Ähnlich, wie „Yahoo“ bietet Cuil auch eine kategorisierende Autovervollständigungsfunktion. Mit der „Roll-over“-Funktion macht Cuil die Entscheidungsfindung zudem effizienter, d.h. beim Rollen mit der Maus, wird eine kurze Beschreibung des Inhalts eingeblendet.

Bessere Ergebnisse liefert cuil.com in englischer Sprache, aber auch für eindeutig deutsche Begriffe werden die Suchergebnisse schon auf Deutsch angezeigt.

Nach eigenen Angaben durchsucht Cuil dreimal so viele Seiten wie Google und zehnmal so viele wie Microsoft. Dabei werden die Inhalte der Webseiten analysiert und nach Relevanz für den jeweiligen Suchbegriff gerankt.

„Search less. understand more“ ist das Motto der Suchmaschine Evri. Die Seite ist in der Betaphase nur in englischer Sprache verfügbar. Evri verbindet Informationen, Bilder und Videos aus offen verfügbaren Datenquellen wie Zeitungsartikeln, Wikipedia, Flickr, Youtube, Amazon, Freebase und visualisiert die Verbindungen zwischen dem gesuchten Schlagwort und relevanten Suchbegriffen in einer „Ontologie“. Zusätzliche Filterfunktionen bietet Evri mit Filtern: „top connection“, „category“ und „activity“.

Ein Hauptanliegen von Evri Betreibern ist es, Widgets für Blogs und Websites bereit zu stellen, die die Besucher der Websites und Blogs mit verwandten Informationen versorgen. Folgende Anwendungen sind zurzeit verfügbar: „Evri Toolbar“ als Add-In für den Firefox Browser, „Evri Sidebar“ und „Evri Popover“ für Websites und Blogs sowie „Evri Twitter Widget“, das die neuesten Twitter Meldungen zu gesuchten Schlagwörtern zuliefert.

Hakia gehört zu den vielversprechendsten Suchanwendungen in der Betaphase. Gegründet in 2004, nutzt Hakia selbst entwickelte QDEX Infrastruktur (for Query Detection and Extraction) für die Satzanalyse, SemanticRank Algorithmus-Verfahren für die Suche und ontologische Semantik, um Konzepte miteinander zu verknüpfen. Als Grundlage liegt eine lexikonbasierte englischsprachige Ontologie, mit über 100 000 Einträgen.

Die Suchanfrage kann bei Hakia als Frage formuliert werden, da der Suchdienst „natural language processing“ unterstützt. Im Vergleich zu anderen Suchdiensten bietet Hakia zusätzlich zu Kategorisierungsfunktionen, verbesserte Bedienungsfunktionen wie:

  • Dialogfunktion, die eine kurze Antwort auf die gestellte Frage liefert;

  • Farbliche Hervorhebung von wichtigsten Inhalten;

  • Parallele Suche von verwandten Begriffen, wie z.B. „kill“=„murder“;

  • Ununterbrochene Ergebnisanzeige, die einen angenehmeres Leseergebnis ermöglicht;

  • Für Oberthemen „environment“ und “health“ bietet Hakia Inhalte von als zuverlässig eingestuften Webseiten an.

Mit Mashups wie „ScoopBar“ und „Search Box“ bietet „Hakia“ die Möglichkeit den Usern und Webseitenbetreibern die Suchdienste in die Browser Toolbar oder eigene Webseite einzubauen. Die Funktion „Search Box“ für semantische Suche steht den interessierten Seitenbetreibern jedoch, nur auf 30 000 Suchanfragen pro Tag begrenzt, zur Verfügung.

Schon länger angekündigt wird Microsoft Powerset und True Knowledge Suchdieste. Powerset durchsucht Wikipedia-Artikel mit „natural language processing“ Verfahren und kategorisiert mit semantischen Technologien verschiedene Suchbegriffe.

Von True Knowledge ist bis dato nur ein Demo Video verfügbar. Die Entwickler versprechen „Direct answers to humans and machine questions” zu liefern. Das bedeutet, dass der Suchdienst nicht nur auf relevante Webseiten verweist, sondern eine Antwort auf die gestellte Frage gibt und die Begründung erläutert, wie der Suchagent zu dieser Antwort gekommen ist.

Von der Ergebnisqualität und visuellen Aufbereitung überzeugen zur Zeit Cuil und Hakia. Es bleibt aber weiterhin spannend, ob nach der Betaphase eine von diesen Anwendungen mit Google mithalten kann. Vielleicht wird Google, ähnlich wie der Mitbewerber Yahoo, bis dahin semantisch nachrüsten?

Sphere: Related Content

Tags: , , , ,

Eine Antwort hinterlassen

Zurück zur Startseite