Wie Suchmaschinen die Inhalte des Web interpretieren Prof. Dr. Dirk Lewandowski [email protected]http://www.bui.haw-hamburg.de/lewandowski.html @Dirk_Lew Humboldt-Universität zu Berlin, Institut für Bibliotheks- und Informationswissenschaft, Berliner Bibliothekswissenschaftliches Kolloquium 7. Juni 2016
30
Embed
Wie Suchmaschinen die Inhalte des Web interpretieren
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Wie Suchmaschinen die Inhalte des Web interpretieren
Prof. Dr. Dirk Lewandowski [email protected] http://www.bui.haw-hamburg.de/lewandowski.html @Dirk_Lew Humboldt-Universität zu Berlin, Institut für Bibliotheks- und Informationswissenschaft, Berliner Bibliothekswissenschaftliches Kolloquium 7. Juni 2016
Einordnung des Themas
• Suchmaschinen sind der beliebteste Dienst des Internet (Frees & Koch 2015)
• Google allein verarbeitet mehr als 2.000.000.000.000 Suchanfragen pro Jahr (Sullivan 2016)
• Suchmaschinen sind der zentrale Weg, um an Informationen im Web zu gelangen (vgl. Lewandowski 2015, Kapitel 2)
– Geschlechter- und Rassenstereotypen: „Black Girls“ (Noble 2013)
– Bevorzugung von Verschwörungstheorien bei entsprechenden Anfragen (Ballatore 2015)
– Dramatische Interpretation von Krankheitssymptomen (White & Horwitz 2009)
Beispiel: Martin Luther King Screenshot vom 7.8.2014
Wie viele relevante Dokumente gibt es eigentlich zu einer Suchanfrage?
• Es gibt für informationsorientierte Suchanfragen meist mehr relevante Dokumente, als auf den vorderen Positionen angezeigt werden können.
• Nutzer sehen in der Regel eine geringere Zahl relevanter Dokumente an, als insgesamt von einer Suchmaschine ausgegeben werden.
• Auch auf niedrigen Positionen finden sich noch relevante Ergebnisse (Podgajnik 2013; Schaer, Mayr, Sünkler & Lewandowski 2016).
• Nutzer bewerten die Relevanz der Dokumente unterschiedlich.
Was bekommen Nutzer tatsächlich zu sehen? Woraus wählen sie aus?
• Auf Top-Positionen tauchen besonders häufig Dokumente aus einigen besonders populären Quellen auf (Höchstötter & Lewandowski 2009).
• Etwa 80 Prozent aller Klicks auf den Trefferseiten entfallen auf nur 10.000 Websites (Goel, Broder, Gabrilovich & Pang 2010).
Ausweg Personalisierung?
• Das Versprechen der Personalisierung: Bessere Suchergebnisse (Re-Ranking) durch die Auswertung des individuellen Nutzerverhaltens.
• Effekt und/oder Nutzen der Personalisierung wurde bislang nicht nachgewiesen.
• Probleme der Personalisierung – Benötigt Daten des individuellen Nutzers
– Führt zu noch stärkerer Intransparenz der Rankings
4. Fazit und Implikationen
Fazit (1/4): Zusammenfassung
• Suchmaschinen interpretieren die Inhalte des Web. • Die starke (und implizite) Interpretation ist auch eine Reaktion auf das
Nutzerverhalten.
• Die Qualitätsbewertung orientiert sich vor allem an der Popularität der Dokumente und versucht darüber, Vertrauenswürdigkeit und Glaubwürdigkeit zu messen.
• Jeder algorithmischen Interpretation der Dokumente sind Annahmen inhärent, die zu Verzerrungen bzw. „Fehlinterpretationen“ führen.
Fazit (2/4): Forschungsbedarf
• Effekte der Interpretation durch Suchmaschinen, abseits von Fallstudien • Einfluss der algorithmischen Interpretation auf die Meinungsbildung
• Untersuchungen zum Einfluss von Suchmaschinenoptimierung auf die Suchergebnisse
• Auswirkungen der Personalisierung
Fazit (3/4): Gesellschaftliche Implikationen
• Erheblicher Einfluss von Suchmaschinen, speziell Google, auf den Wissenserwerb in der Gesellschaft – eine dominierende Interpretation.
• Wie kann Vielfalt erreicht werden? – Selbstregulierung des Marktes (Monopolkommission 2015) – Schaffung einer alternativen Suchmaschine (Hege & Flecken 2014)
– Aufbau eines Offenen Web-Index (Lewandowski 2014a)
Fazit (4/4): Übertragbarkeit
• Verfahren, die bei Suchmaschinen verwendet werden, aber weiterreichend von Bedeutung sind:
– Social Media (Bsp. Zusammenstellung der Facebook-Timeline)
– Online Dating
– Zusammenstellung von Nachrichtenseiten (Bsp. Google News)
Vielen Dank für Ihre Aufmerksamkeit
Prof. Dr. Dirk Lewandowski Hochschule für Angewandte Wissenschaften Hamburg, Department Information [email protected] Website: www.searchstudies.org
Literatur
• Ballatore, A. (2015). Google chemtrails: A methodology to analyze topic representation in search engine results. First Monday, 20(7). • Bar-Ilan, J. (2006). Web links and search engine ranking: The case of Google and the query “Jew.” Journal of the American Society for
Information & Techology, 57(12), 1581–1589. • Frees, B., & Koch, W. (2015). Internetnutzung : Frequenz und Vielfalt nehmen in allen Altersgruppen zu. Media Perspektiven, (10), 366–377.
• Goel, S., Broder, A., Gabrilovich, E., & Pang, B. (2010). Anatomy of the long tail: Ordinary people with extraordinary tastes. In Proceedings of the third ACM international conference on Web search and data mining (pp. 201–210). ACM.
• Hege, H., & Flecken, E. (2014). Debattenbeitrag: Gibt es ein öffentliches Interesse an einer alternativen Suchmaschine? In B. Stark, D. Dörr, & S. Aufenanger (Eds.), Die Googleisierung der Informationssuche (pp. 224–244). Berlin: De Gruyter.
• Höchstötter, N., & Lewandowski, D. (2009). What users see – Structures in search engine results pages. Information Sciences, 179(12), 1796–1812. doi:10.1016/j.ins.2009.01.028
• Introna, L. D., & Nissenbaum, H. (2000). Shaping the Web: Why the Politics of Search Engines Matters. The Information Society, 16(3), 169–185. • Lewandowski, D. (2012). Credibility in Web Search Engines. In M. Folk & S. Apostel (Eds.), Online Credibility and Digital Ethos: Evaluating
Computer-Mediated Communication (pp. 131–146). Hershey, PA: IGI Global. • Lewandowski, D. (2014a). Why we need an independent index of the Web. In R. König & M. Rasch (Eds.), Society of the Query Reader:
Reflections on Web Search (pp. 49–58). Information Retrieval; Digital Libraries, Amsterdam: Institute of Network Culture.
• Lewandowski, D. (2014b). Wie lässt sich die Zufriedenheit der Suchmaschinennutzer mit ihren Suchergebnissen erklären? In H. Krah & R. Müller-Terpitz (Eds.), Suchmaschinen (Passauer Schriften zur interdisziplinären Medienforschung, Band 4) (pp. 35–52). Münster: LIT.
• Lewandowski, D., Drechsler, J., & Mach, S. Von. (2012). Deriving Query Intents From Web Search Engine Queries. Journal of the American Society for Information Science and Technology, 63(9), 1773–1788.
Literatur
• Engine Queries. Journal of the American Society for Information Science and Technology, 63(9), 1773–1788. • Lewandowski, D., & Sünkler, S. (2013). Representative online study to evaluate the revised commitments proposed by Google on 21 October 2013
as part of EU competition investigation AT.39740-Google Report for Germany. • Machill, M., & Beiler, M. (2008). Suchmaschinen als Vertrauensgüter. Internet-Gatekeeper für die Informationsgesellschaft ? In D. Klumpp, H.
Kubicek, A. Roßnagel, & W. Schulz (Eds.), Informationelles Vertrauen für die Informationsgesellschaft (pp. 159–172). Heidelberg: Springer. • Machill, M., Neuberger, C., Schweiger, W., & Wirth, W. (2003). Wegweiser im Netz: Qualität und Nutzung von Suchmaschinen. In M. Machill & C.
Welp (Eds.), Wegweiser im Netz (pp. 13–490). Gütersloh: Bertelsmann Stiftung.
• Noble, S. U. (2013). Google Search: Hyper-visibility as a Means of Rendering Black Women and Girls Invisible. InVisible Culture: An Electronic Journal for Visual Culture. Retrieved November 13, 2015, from http://ivc.lib.rochester.edu/google-search-hyper-visibility-as-a-means-of-rendering-black-women-and-girls-invisible/
• Pan, B., Hembrooke, H., Joachims, T., Lorigo, L., Gay, G., & Granka, L. (2007). In Google we trust: users’ decisions on rank, position, and relevance. Journal of Computer-Mediated Communication, 12(3), 801–823.
• Piper, P. S. (2000). Better Read That Again: Web Hoaxes and Misinformation. Searcher. Searcher, 8(8), 40.
• Purcell, K., Brenner, J., & Raine, L. (2012). Search Engine Use 2012. Search. Washington, DC.
• Röhle, T. (2010). Der Google-Komplex: Über Macht im Zeitalter des Internets. Bielefeld: Transcript.
• Stark, B., Magin, M., & Jürgens, P. (2014). Navigieren im Netz – Befunde einer qualitativen und quantitativen Nutzerbefragung. In B. Stark, D. Dörr, & S. Aufenanger (Eds.), Die Googleisierung der Informationssuche - Suchmaschinen im Spannungsfeld zwischen Nutzung und Regulierung (pp. 20–74). Berlin: De Gruyter.
Literatur
• Sullivan, D. (2016). Google now handles at least 2 trillion searches per year. Search Engine Land. Retrieved from http://searchengineland.com/
google-now-handles-2-999-trillion-searches-per-year-250247 • Tavani, H. (2012, August 27). Search Engines and Ethics. Retrieved August 12, 2015, from http://plato.stanford.edu/entries/ethics-search/
• Tremel, A. (2010). Suchen, finden–glauben?: Die Rolle der Glaubwürdigkeit von Suchergebnissen bei der Nutzung von Suchmaschinen. Ludwig-Maximilians-Universität München.
• Westerwick, A. (2013). Effects of Sponsorship, Web Site Design, and Google Ranking on the Credibility of Online Information. Journal of Computer-Mediated Communication, 18(2), 80–97. doi:10.1111/jcc4.12006
• White, R. W., & Horvitz, E. (2009). Cyberchondria. ACM Transactions on Information Systems, 27(4), Article No. 23. doi:10.1145/1629096.1629101 • Zetter, K. (2008). Six-year old news story causes United Airlines stock to plummet - update Google placed wrong date on story. Wired. Retrieved
from http://www.wired.com/2008/09/six-year-old-st/