Mitglied der Krautsourcing?! Krautsourcing?! Krautsourcing?! Krautsourcing?! oder: Wie können wir am IDS das „Mitmach-Internet“ für uns nutzen? Caren Brinckmann IDS-Gesprächsrunde am 15.03.2007
Mitglied der
Krautsourcing?!Krautsourcing?!Krautsourcing?!Krautsourcing?!oder:
Wie können wir am IDS das „Mitmach-Internet“ für uns nutzen?
Caren BrinckmannIDS-Gesprächsrunde am 15.03.2007
Caren Brinckmann IDS-Gesprächsrunde 15.03.07
Mitglied der
2
ÜÜÜÜberblickberblickberblickberblick• Web 2.0:
� Begriffsklärung� Beispiele
� Prinzipien
• Crowdsourcing:� Begriffsklärung� Beispiele
� Erfolgsfaktoren
• Krautsourcing am IDS?� Beispiel Sprachdatensammlung „Deutsch Heute“
Caren Brinckmann IDS-Gesprächsrunde 15.03.07
Mitglied der
3
Was bedeutet Web 2.0?Was bedeutet Web 2.0?Was bedeutet Web 2.0?Was bedeutet Web 2.0?• Marketing-Schlagwort von Dale Dougherty (Vize-Präsident des
Computerbuchverlags O‘Reilly) → Titel einer Konferenzreihe
• Oberbegriff für die Beschreibung einer Reihe (neuer) interaktiver Techniken und Dienste des WWW, die lediglich Strukturen, aber keine eigenen Inhalte zur Verfügung stellen.
• Tim Berners-Lee: „I think Web 2.0 is of course a piece of jargon, nobody even knows what it means.”
• Web 1.0: Webseiten werden jeweils von einer Person/Organisation publiziert und vom Benutzer rezipiert.
• Web 2.0: Benutzer erstellen und/oder bearbeiten im Internet bereitgestellte Inhalte selbst.
• Typische Beispiele: Wikis, Blogs, Foto- und Video-Sharing-Portale, Social Bookmarking, Empfehlungsseiten, Kartierungsplattformen, Netzwerk-Plattformen, Webtop-Software
Caren Brinckmann IDS-Gesprächsrunde 15.03.07
Mitglied der
4
Bekanntestes Wiki: WikipediaBekanntestes Wiki: WikipediaBekanntestes Wiki: WikipediaBekanntestes Wiki: Wikipedia
Caren Brinckmann IDS-Gesprächsrunde 15.03.07
Mitglied der
5
IDSIDSIDSIDS----Wiki: Lexik WebWiki: Lexik WebWiki: Lexik WebWiki: Lexik Web
Caren Brinckmann IDS-Gesprächsrunde 15.03.07
Mitglied der
6
(We)blogs: Online(We)blogs: Online(We)blogs: Online(We)blogs: Online----TagebTagebTagebTagebüüüüchercherchercher
Caren Brinckmann IDS-Gesprächsrunde 15.03.07
Mitglied der
7
FotoFotoFotoFoto----SharingSharingSharingSharing----Portal: flickr.comPortal: flickr.comPortal: flickr.comPortal: flickr.com
Caren Brinckmann IDS-Gesprächsrunde 15.03.07
Mitglied der
8
VideoVideoVideoVideo----SharingSharingSharingSharing----Portal: youtube.comPortal: youtube.comPortal: youtube.comPortal: youtube.com
Caren Brinckmann IDS-Gesprächsrunde 15.03.07
Mitglied der
9
Social Bookmarking: misterSocial Bookmarking: misterSocial Bookmarking: misterSocial Bookmarking: mister----wong.dewong.dewong.dewong.de
Caren Brinckmann IDS-Gesprächsrunde 15.03.07
Mitglied der
10
Empfehlungsseite qype.deEmpfehlungsseite qype.deEmpfehlungsseite qype.deEmpfehlungsseite qype.de
Caren Brinckmann IDS-Gesprächsrunde 15.03.07
Mitglied der
11
Kartierungsplattform local.live.comKartierungsplattform local.live.comKartierungsplattform local.live.comKartierungsplattform local.live.com
Caren Brinckmann IDS-Gesprächsrunde 15.03.07
Mitglied der
12
NetzwerkNetzwerkNetzwerkNetzwerk----Plattform xing.com (openBC)Plattform xing.com (openBC)Plattform xing.com (openBC)Plattform xing.com (openBC)
Caren Brinckmann IDS-Gesprächsrunde 15.03.07
Mitglied der
13
WebtopWebtopWebtopWebtop----Software docs.google.comSoftware docs.google.comSoftware docs.google.comSoftware docs.google.com
Caren Brinckmann IDS-Gesprächsrunde 15.03.07
Mitglied der
14
WebtopWebtopWebtopWebtop----Software docs.google.comSoftware docs.google.comSoftware docs.google.comSoftware docs.google.com
Caren Brinckmann IDS-Gesprächsrunde 15.03.07
Mitglied der
15
Web 2.0 PrinzipienWeb 2.0 PrinzipienWeb 2.0 PrinzipienWeb 2.0 Prinzipien
2006 O‘Reilly Verlag
Caren Brinckmann IDS-Gesprächsrunde 15.03.07
Mitglied der
16
Web 2.0 BegriffswolkeWeb 2.0 BegriffswolkeWeb 2.0 BegriffswolkeWeb 2.0 Begriffswolke
© Markus Angermeier, Aperto
Caren Brinckmann IDS-Gesprächsrunde 15.03.07
Mitglied der
17
Was ist Crowdsourcing?Was ist Crowdsourcing?Was ist Crowdsourcing?Was ist Crowdsourcing?• Wortschöpfung von Jeff Howe im Wired-Magazin (Ausgabe Juni 2006)• Outsourcing: Auslagerung von Unternehmensaufgaben und
Produktionsschritten an Drittunternehmen.• Crowdsourcing: Auslagerung von Unternehmensaufgaben an eine Menge
von Menschen, die diese Aufgaben (meist kostenlos) in ihrer Freizeit lösen.→ Aal-Prinzip (andere arbeiten lassen) bzw. LOW (let others work)
• Klassisches Crowdsourcing: Selbstbedienungsrestaurant, Supermarkt, IKEA, Maßkonfektion, Geld- und Fahrkartenautomaten
• Neu: Internet als Medium und Plattform für alle Prozesse zwischen Unternehmen und dem Heer von Freizeitarbeitern
• Die Masse ist intelligenter als der Einzelne („wisdom of crowds“), kann Probleme schnell und günstig lösen, einfach nur bereitwillig Inhalte generieren oder gar Forschung betreiben.
• „Definieren Sie Web2.0 für Deutschland!“ – „Krautsourcing?“(© micro_robert auf elektrosmog.antville.org am 11.12.2006)
Caren Brinckmann IDS-Gesprächsrunde 15.03.07
Mitglied der
18
Bildagentur: iStockphotoBildagentur: iStockphotoBildagentur: iStockphotoBildagentur: iStockphoto
Caren Brinckmann IDS-Gesprächsrunde 15.03.07
Mitglied der
19
TTTT----Shirt Design: LaFraise.comShirt Design: LaFraise.comShirt Design: LaFraise.comShirt Design: LaFraise.com
Caren Brinckmann IDS-Gesprächsrunde 15.03.07
Mitglied der
20
Artificial artificial intelligence: mturk.comArtificial artificial intelligence: mturk.comArtificial artificial intelligence: mturk.comArtificial artificial intelligence: mturk.com
Caren Brinckmann IDS-Gesprächsrunde 15.03.07
Mitglied der
21
Artificial artificial intelligence: mturk.comArtificial artificial intelligence: mturk.comArtificial artificial intelligence: mturk.comArtificial artificial intelligence: mturk.com
Caren Brinckmann IDS-Gesprächsrunde 15.03.07
Mitglied der
22
Forschungsaufgaben lForschungsaufgaben lForschungsaufgaben lForschungsaufgaben löööösen: Innocentivesen: Innocentivesen: Innocentivesen: Innocentive
Caren Brinckmann IDS-Gesprächsrunde 15.03.07
Mitglied der
23
Distributed Proofreaders: pgdp.netDistributed Proofreaders: pgdp.netDistributed Proofreaders: pgdp.netDistributed Proofreaders: pgdp.net
Caren Brinckmann IDS-Gesprächsrunde 15.03.07
Mitglied der
24
Bildbenennungen sammeln: ESP gameBildbenennungen sammeln: ESP gameBildbenennungen sammeln: ESP gameBildbenennungen sammeln: ESP gameCrowdsourcing als Spiel (Luis von Ahn, CMU: Crowdsourcing als Spiel (Luis von Ahn, CMU: Crowdsourcing als Spiel (Luis von Ahn, CMU: Crowdsourcing als Spiel (Luis von Ahn, CMU: „„„„games with a purposegames with a purposegames with a purposegames with a purpose““““))))
Caren Brinckmann IDS-Gesprächsrunde 15.03.07
Mitglied der
25
ESP game als Google Image LabelerESP game als Google Image LabelerESP game als Google Image LabelerESP game als Google Image Labeler
Caren Brinckmann IDS-Gesprächsrunde 15.03.07
Mitglied der
26
Weltwissen sammeln: VerbosityWeltwissen sammeln: VerbosityWeltwissen sammeln: VerbosityWeltwissen sammeln: Verbosity• Inspiration: Party-Spiel „Tabu“
• Beschreiber füllt Lückensätze:� It is a kind of ____� It is used for ____� It is typically near ____� It is the opposite of ____� It is related to ____
• ESP game: symmetrische Verifikation
• Verbosity: asymmetrische Verifikation
Caren Brinckmann IDS-Gesprächsrunde 15.03.07
Mitglied der
27
Jugendsprache aufnehmen: Ph@ttSessionzJugendsprache aufnehmen: Ph@ttSessionzJugendsprache aufnehmen: Ph@ttSessionzJugendsprache aufnehmen: Ph@ttSessionz
Caren Brinckmann IDS-Gesprächsrunde 15.03.07
Mitglied der
28
Erfolgsfaktoren fErfolgsfaktoren fErfolgsfaktoren fErfolgsfaktoren füüüür Crowdsourcingr Crowdsourcingr Crowdsourcingr Crowdsourcing----ProjekteProjekteProjekteProjekte©©©© BusinessWeekBusinessWeekBusinessWeekBusinessWeek
1. Richtige Fokussierung:� konkrete Fragen und Aufgaben stellen, genaue Aufgabenstellung leicht
verständlich und kurz beschreiben
2. Gutes Filtern der Ideen/Antworten:� Crowd + Experten am Auswahlprozess beteiligen, um die besten
Ideen/Antworten herauszufiltern
3. Die besten Experten in der Masse finden: 1%-Regel� 1000 registrierte Teilnehmer – 10 Teilnehmer (=1%) generieren
Ideen/Antworten – 100 Teilnehmer (=10%) bewerten die Antworten⇒ gezielte Ansprache von möglichen Ideengeneratoren wichtig!
4. Aufbau einer Fancommunity� angemessene Entlohnung der wirklich aktiven Ideengeneratoren: virtuelle
Titel + hohe Bewertungszahl, Einbindung in den weiteren Entwicklungsprozess neuer Produkte, Besuch der Firma/des Instituts…
Caren Brinckmann IDS-Gesprächsrunde 15.03.07
Mitglied der
29
Was hat das mit dem IDS zu tun?Was hat das mit dem IDS zu tun?Was hat das mit dem IDS zu tun?Was hat das mit dem IDS zu tun?• Sprachdatenerhebung „Deutsch Heute“ (im Rahmen des
IDS-Projekts „Variation des gesprochenen Deutsch“)
• Aufnahmen an 160 Orten im gesamten deutschen Sprachraum (D, A, CH, LUX, I, B, FL)
• vier Oberstufenschüler (17-20 Jahre) pro Ort und zwei Erwachsene (50+) an 50 Orten ⇒ 740 Sprecher à 90 Minuten
• Material: Texte, Sätze, Bildbenennungen, Übersetzung aus dem Englischen (Wörter und Sätze), Wortliste, Minimalpaare, sprachbiografisches Interview, Map Task
Caren Brinckmann IDS-Gesprächsrunde 15.03.07
Mitglied der
30
Map TaskMap TaskMap TaskMap Task
Caren Brinckmann IDS-Gesprächsrunde 15.03.07
Mitglied der
31
Datenaufbereitung und AnnotationDatenaufbereitung und AnnotationDatenaufbereitung und AnnotationDatenaufbereitung und Annotation• orthografische Transkription:
� Lesesprache: manuelles Text-Ton-Alignment auf Wort-/Teilsatzebene (Automatisierung mit Praat-Skript)
� Spontansprache: komplett manuelle orthographische Transkription und Text-Ton-Alignment auf Teilsatzebene
• geplant: � phänomenorientierte variationslinguistische Annotation� automatische breite phonetische Transkription (kanonisch) +
automatisches Alignment auf Phonebene
� enge phonetische Transkription und signalphonetische Analysen ausgewählter Datensätze
Caren Brinckmann IDS-Gesprächsrunde 15.03.07
Mitglied der
32
Problem: DatenmengeProblem: DatenmengeProblem: DatenmengeProblem: Datenmenge• Gesamtdauer der orthographischen Transkription:
>30.000h ⇒ 5 Hiwis mit 50h/Monat würden 10 Jahre brauchen.
• Und das ist nur die orthografische Transkription!
• Momentane Lösung:� Nur das lesesprachliche Material wird aufbereitet. Interview und
Map Task bleiben unaufbereitet.
� Test von automatischen Spracherkennern und Alignern (Robustheit)
Caren Brinckmann IDS-Gesprächsrunde 15.03.07
Mitglied der
33
Problem: Dialektale DatenProblem: Dialektale DatenProblem: Dialektale DatenProblem: Dialektale Daten
• orthografische Transkription des spontansprachlichen Materials erfordert tw. Dialektkenntnisse
• automatische Sprach-erkenner hierfür nicht robust genug
Caren Brinckmann IDS-Gesprächsrunde 15.03.07
Mitglied der
34
LLLLöööösung: Krautsourcing!sung: Krautsourcing!sung: Krautsourcing!sung: Krautsourcing!• orthografische Transkription der Spontandaten wird am
besten von den Sprechern des jeweiligen Dialekts angefertigt
• mögliche Umsetzung:� Datenbank und web-basierte Transkriptionssoftware
WebTranscribe (eingesetzt im Projekt Ph@ttSessionz)� Qualitätssicherung: Mehrfachtranskription und Kontrollaufgaben
(wie CastingWords auf mturk.com)� Experten finden: Schulen kontaktieren, Studenten (StudiVZ?)� Anreize: Punkte sammeln, IDS-Besuch, …?� Spiel???
Caren Brinckmann IDS-Gesprächsrunde 15.03.07
Mitglied der
35
Vielen Dank! Vielen Dank! Vielen Dank! Vielen Dank! ☺☺☺☺