GAZTEEN HARREMANAK HELDUEN HARREMANAK Datuen erauzketa • Euskal txiolariak identifikatu (umap.eus) • Twitterretik informazioa atera tweepy bitartez Gazte sailkatzailea • Machine Learning sailkatzailea: ixa-pipe-doc • Idazteko eraren arabera sailkatu: formal/informal GAIAK • Txio pertsonalen testuan oinarriturik gaiak azaleratu • Topic-modeling teknika: LDA algoritmoa HARREMANAK • Birtxioetan oinarrituta harremanen grafoa sortu • Azpi-taldeak sortzeko "Modularity" algoritmoa 1.579 erabiltzaile GAZTEAK 5.508 erabiltzaile HELDUAK GAZTEAK ETA EUSKARA SARE SOZIALETAN Zer, nori, nork: euskarazko txio formal eta informalak sailkatuz eta konparatuz • 530.226 txio pertsonal euskaraz • 400.448 birtxio euskaraz • 2.634.534 txio pertsonal euskaraz • 2.421.058 birtxio euskaraz TWITTER: EUSKAL TXIOLARIAK 8.189 erabiltzaile euskaldun: 5.198.043 txio pertsonal o 3.171.485 euskaraz (%61) 5.473.031 birtxio o 2.891.136 euskaraz (%53) Joseba Fernandez de Landa Agirre [email protected]