Top Banner
15.04.13 1 Neue Entwicklungen im Suchmaschinenbereich und deren Relevanz für Bibliotheken Prof. Dr. Dirk Lewandowski [email protected] http://www.bui.haw-hamburg.de/lewandowski.html @Dirk_Lew Semantik? „Semantic Web“ – Idee, dass durch semantische Auszeichnungen alle Inhalte des Web miteinander verbunden werden und von Maschinen verstanden werden können. – Alternative Ansätze: Linked Open Data, ... „Low Level Semantics“ – Faktenextraktion aus „chaotischen“ Dokumenten – Einfache Auszeichnungen durch Website-Betreiber (Eigeninteresse bedienen) Verstehen der Dokumente vs. Verstehen der Suchanfragen
11

Neue Entwicklungen bei Suchmaschinen und deren Relevanz für Bibliotheken (2)

Jan 25, 2015

Download

Internet

 
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Page 1: Neue Entwicklungen bei Suchmaschinen und deren Relevanz für Bibliotheken (2)

15.04.13

1

Neue Entwicklungen im Suchmaschinenbereich und deren Relevanz für Bibliotheken

Prof. Dr. Dirk Lewandowski [email protected] http://www.bui.haw-hamburg.de/lewandowski.html @Dirk_Lew

Semantik?

•  „Semantic Web“ –  Idee, dass durch semantische Auszeichnungen alle Inhalte des Web miteinander

verbunden werden und von Maschinen verstanden werden können.

–  Alternative Ansätze: Linked Open Data, ...

•  „Low Level Semantics“ –  Faktenextraktion aus „chaotischen“ Dokumenten

–  Einfache Auszeichnungen durch Website-Betreiber (Eigeninteresse bedienen)

•  Verstehen der Dokumente vs. Verstehen der Suchanfragen

Page 2: Neue Entwicklungen bei Suchmaschinen und deren Relevanz für Bibliotheken (2)

15.04.13

2

Semantische Annotation von Dokumenten

•  Semantische Annotationen können in der Suche ausgenutzt werden, um •  die Ergebnisqualität zu verbessern •  die Trefferdarstellung („Snippets“) zu verbessern

•  Das Problem von „echten“ Semantic-Web-Anwendungen ist die Komplexität in der Erstellung.

•  Die großen Suchmaschinen haben sich auf ein gemeinsames Format für semantische Annotationen geeignet, das in HTML umgesetzt wird.

Beispiel Google Knowledge Graph

Page 3: Neue Entwicklungen bei Suchmaschinen und deren Relevanz für Bibliotheken (2)

15.04.13

3

Suchanfragen verstehen

•  bbl •  vatikan •  stockbrot •  motonetix •  nedcom •  fußball •  drehscheibe •  frauentausch •  seelenfarben •  kachelmannwetter •  osterei •  wie ich •  wgt

Page 4: Neue Entwicklungen bei Suchmaschinen und deren Relevanz für Bibliotheken (2)

15.04.13

4

Suchanfragen im Kontext

Beispiel: Navigationsorientierte Suchanfragen anhand von Klicks bestimmen

(Lewandowski, Drechsler & von Mach, 2012)

Page 5: Neue Entwicklungen bei Suchmaschinen und deren Relevanz für Bibliotheken (2)

15.04.13

5

Semantische Suche

•  Verbesserung der Qualität der Suchergebnisse durch –  Verstehen der Suchanfrage –  Kontextsensitive Vorschläge zur Verbesserung der Suchanfrage –  Verstehen der Dokumente, dadurch besserer Abgleich mit der Suchanfrage –  Semantische Anreicherung der Ergebnisbeschreibungen („Snippets“), dadurch

besser fundierte Entscheidung der Nutzer? –  Präsentation von aus Dokumenten zusammengestellten Ergebnissen (auf den

Seiten der Suchmaschine)

Soziale Suche

•  Problem des bisherigen Rankings: Qualität wird vor allem durch Popularität (Links/Klicks) gemessen

•  Populär bei der Masse

•  Populär in einer bestimmten Nutzergruppe

•  Populär bei einem bestimmten Nutzer (Personalisierung)

•  Das Versprechen des „Social Ranking“:

•  Von Bekannten empfohlene Suchergebnisse sind relevanter und vertrauenswürdiger.

•  Problem: Im Gegensatz zu Linkdaten aus dem freien Web handelt es sich bei Sozialen Netzwerken um geschlossene Netzwerke, auf die die Suchmaschinen nicht per Crawling zugreifen können.

Page 6: Neue Entwicklungen bei Suchmaschinen und deren Relevanz für Bibliotheken (2)

15.04.13

6

Bing und Facebook

•  Vereinbarung über die Nutzung von Facebook-Daten in Bing –  Anmeldung in Bing mit dem Facebook-Account –  Bislang nur in den USA verfügbar –  Bing-Websuche in Facebook integriert

•  Anreicherung der Suchergebnisse durch Daten aus Facebook –  Hervorhebung von Suchergebnisse durch Empfehlungen von Freunden –  Höheres Ranking von empfohlenen Ergebnissen –  Möglichkeit, Suchergebnisse in Facebook zu posten –  Diskussion mit Facebook-Freunden auf den Bing-Ergebnisseiten

12 | Dirk Lewandowski

•  x

Page 7: Neue Entwicklungen bei Suchmaschinen und deren Relevanz für Bibliotheken (2)

15.04.13

7

Google und Google+

•  Aufbau eines eigenen sozialen Netzwerks durch Google –  Integration in alle Google-Dienste –  Bislang allerdings nicht besonders erfolgreich

•  Anreicherung der Suchergebnisse –  Hervorhebung von Suchergebnisse durch Empfehlungen von Freunden –  Höheres Ranking von empfohlenen Ergebnissen

•  Weiterer Nutzen von Google+ –  „Klarnamen-Pflicht“ –  Kombination mit anderen Profilen im Web (Twitter, etc.) –  Verbindung mit Daten zur Autorschaft (rel=author)

à Dadurch „Vertrauens-Graph“ als weitere Komponente des Rankings

Fazit Soziale Suche

•  Soziale Suche vielschichtig (kollaborative Suche, ...), wichtigster Punkt ist aber das Einbeziehen von Daten aus sozialen Netzwerken in das Ranking und die Ergebnispräsentation.

•  Beide großen Suchmaschinen haben Ansätze, solche Daten zu integrieren. –  Vorteil Bing: Daten aus dem Netzwerk, in dem tatsächlich etwas los ist. –  Vorteil Google: Tiefere Integration möglich, da es sich um ein eigenes Netzwerk

handelt.

Page 8: Neue Entwicklungen bei Suchmaschinen und deren Relevanz für Bibliotheken (2)

15.04.13

8

15 |

•  x

Anzeigen

Nachrichten

Bilder

Videos

Blogbeiträge

Zusammenstellung der Suchergebnisse

•  Das Suchanfragevolumen ist sehr ungleichmäßig verteilt.

•  Treffer auf den vorderen Plätzen werden sehr stark bevorzugt.

•  Durch entsteht ein großer Einfluss von Suchmaschinen (Google) auf das, was Nutzer zu sehen bekommen.

1.  Dürfen die Suchmaschinen ihre eigenen Angebote / die Angebote von Partnern in der Ergebnisdarstellung bevorzugen?

2.  Tun sie das?

•  „Such-Neutralität“ bedeutet, dass eine Suchmaschine alle Dokumente im Index nach gleichen Kriterien in das Ranking mit einbezieht.

Page 9: Neue Entwicklungen bei Suchmaschinen und deren Relevanz für Bibliotheken (2)

15.04.13

9

17 | Dirk Lewandowski

•  x

18 | Dirk Lewandowski

•  x

Page 10: Neue Entwicklungen bei Suchmaschinen und deren Relevanz für Bibliotheken (2)

15.04.13

10

19 | Dirk Lewandowski

•  x

Problemfelder

•  Bevorzugung eigener Angebote –  In den organischen Ergebnissen –  In den Universal-Search-Ergebnissen

•  Aufnahme in den Index –  Bsp. Paid Inclusion bei Google Shopping: Eintragungen sind kostenpflichtig –  Folgen weitere Dienste (Places, ...)?

à Kennzeichnung als eigenes Angebot bzw. Partnerangebot als Lösung?

Page 11: Neue Entwicklungen bei Suchmaschinen und deren Relevanz für Bibliotheken (2)

15.04.13

11

Vielen Dank für die Aufmerksamkeit.

Prof. Dr. Dirk Lewandowski Hochschule für Angewandte Wissenschaften Hamburg, Department Information

http://www.bui.haw-hamburg.de/lewandowski.html

[email protected] @Dirk_Lew