Tiedonetsinnän perusteet
Post on 27-Jan-2016
41 Views
Preview:
DESCRIPTION
Transcript
Tiedonetsinnän perusteet
Juha Heinänen
Kankaanpään kaupunginkirjasto
Sisällysluettelo
• Tiedonhaku prosessina
• Erilaisia tietolähteitä
• Tiedonhaku
• Hakutulosten arviointi
Tiedonhaku prosessina
• Tiedontarve
• Tietolähteen valinta
• Hakustrategia
• Tulosten arviointi
• Mahdolliset lisähaut
Tiedon tarve
• Mitä tietoa tarvitaan?
• Mihin tarkoitukseen?
• Miten kattavasti?
• Miten nopeasti?
• Vuorovaikutuksessa seuraavan kohdan kanssa
Tietolähteen valinta
• Tiedon tarve vaikuttaa siihen mistä lähteestä sitä kannattaa etsiä
• Laadukkaasta tieteellisestä tiedosta suuri osa edelleen paperilla
• Tieteenalasta riippuu julkaistaanko se artikkeleina vai laajempina kirjoina eli monografioina
• Sähköinen julkaisu on tulossa
Tietolähteitä
• Kirjat
• Lehdet, aikakausjulkaisut
• Sähköiset aineistot – tietokannat, cd-romit
• Kirjastojen aineistoluettelot
• www- sivustot
Kirjat
• Luettavuudeltaan vielä ylivoimainen tietolähde
• Vanhoja perustapoja löytää kirjoja
• Kirjaston kokoelman selailu
• Hakuteokset
• Bibliografiat
• Kirjojen lähdeluettelot
Kirjastojen aineistoluettelot
• Kirjastojen kokoelmatietokannat ovat nykyään yleisesti selattavissa verkon kautta
• Kankaanpään kaupunginkirjasto: http://www.kankaanpaa.fi/sivistyskeskus//html/fi/kirjasto.html
• Suomen yleiset ja oppilaitoskirjastot: http://www.kirjastot.fi/
Kirjastojen aineistoluettelot
• Hakutietokantoja, jotka vaihtelevat käytetyn ohjelman mukaan, mutta yhteisiä piirteitä
• hakumahdollisuuksia: tekijän nimen, teoksen nimen, asiasanojen tai muiden tekijöiden mukaan
• Tukevat sanojen katkaisua ja boolen logiikkaa – mahdollistavat hyvinkin tarkat haut
Sanan katkaisu
• Tietokoneet vertailevat merkkijonoja, joten aina kun mahdollista kannattaa käyttää katkaisua
• Saadaan haku kattamaan eri sijamuotoja: talo* kattaa talojen, talot ja talo
• Mahdollisuus tehdä virheitä pienenee: Polit* kattaa Politovskajan ja Politkovskajan
• yleisesti merkitään asteriskilla *, muita mahdollisuuksia ?, joskus - joskus ei mitään, kuten Kankaanpään kirjaston verkkohaussa
Boolen logiikka
• Operaattori JA tai AND hakutuloksen pitää täyttää molemmat ehdot - supistaa haun tulosten määrää
• Operaattori TAI tai OR hakutuloksen pitää täyttää joko toinen tai molemmat hakuehdoista – laajentaa hakutulosta
• Operaattori EI tai NOT hakutuloksessa ei saa olla ilmoitettua sanaa
Lehdet
• Paperilehtien sisällöstä osa verkossa
• Pelkästään verkossa ilmestyviä lehtiä
• Verkossa lehtien sisältöä tietokannoissa –suomalaisia Arto (kotimaisten aikakauslehtien artikkeliviitetietokanta) ja Aleksi – joita pääsee käyttämään Nelli-tiedonhakuportaalin kautta www.nelliportaali.fi
Internet
• Kanava, jonka kautta päästään kaikkien edellä lueteltujen tietolähteiden äärelle
• Alku 1960-luvun lopulla perustetussa Arpanet –verkossa ja sen TCP/IP tiedonsiirtoprotokollassa
• 1983 sotilas- ja siviiliverkot erilleen • Räjähdysmäinen kasvu 90-luvun alussa • 1990 www, 1993 Mosaic-selain, joka mahdollisti
www:n käytön tavalliselle käyttäjälle
Internet II
• Yhteen liitettyjen koneiden hajautettu, linkkien yhdistämä verkko, jota ei ole alun perin suunniteltu tiedonhakuun
• Ei kattavaa hakemistoa
• Mikään hakuohjelma ei läpikäy koko verkon julkista sisältöä
• Vapaa ja rajoittamaton sisällöntuotanto – informaation laatu vaihtelee jyrkästi
Aihehakemistot
• Perusajatukseltaan linkkilistoja• Hyvät puolet: sisältö hakemistoissa jollain tavoin
valikoitua – pyrkimys laatuun• Huonot puolet: sisältö valikoitua ja sitä myöten
suppeampaa kuin hakukonehaussa• Soveltuu aihealueisiin joita on hankala määritellä
hakusanoilla• Soveltuu selailuun, kun halutaan yleiskuva
laajemmasta aiheesta
Aihehakemistoja
• Pioneerina yahoo! (http://dir.yahoo.com/)
• Suomessa Hämeenlinnan kaupunginkirjaston makupalat (http://www.makupalat.fi )
• Suppeampaan suuntaan mennessä virtuaalikirjastot, joiden sisältö on valikoitua ja kirjastomaisesti järjesteltyä: http://www.kirjastot.fi/linkkikirjasto
Hakukoneet
• Hakukoneiden haku kohdistuu hakurobottien tekemään tietokantaan
• Hyvät puolet: haun kohteena kokotekstiä miljoonien dokumenttien verran – yleensä aina haku tuottaa jonkinlaisia tuloksia
• Huonot puolet: haku tuottaa usein liikaa tuloksia, joissa parhaat eivät erotu kovinkaan hyvin
Hakukoneet 2
• Google – tunnetuin, muttei ainoa www.google.com tai www.google.fi
• Muita:
- AllTheWeb www.alltheweb.com
- Altavista www.altavista.com
• Ulkoisesti melko samantapaisia
• Mekaaninen sanahaku, jonka tulokset järjestyvät relevanssin mukaan
Käytännön hakuvinkkejä
• Useimmissa mahdollisuutena tarkennettu haku • Sanankatkaisu ei yleensä toimi – voi olla tarpeen
vaihdella hakusanoja• Boolen logiikka toimii – oletuksena yleensä
AND/JA operaattori• Käytä fraasihakuja missä mahdollista: ero
merkittävä esimerkiksi erisnimiä hakiessa• Laajoissa hauissa merkitse muistiin miten olet
hakenut
Tiedonhaun portit
• Portaalit yhdistelevät hakukoneen ja aihehakemistojen ominaisuuksia
• Mahdollistaa räätälöidyn haun, joka yhdistelee molempia tapoja
• Vaikeampia käyttää kuin pikahakukoneet, mutta tieto jäsennellympää
• http://tiedonhaunportti.kirjastot.fi/
• Nelli-portaali http://www.nelliportaali.fi
Julkishallinnon tietoja
• http://www.suomi.fi - valtionhallinnon tietoja kootusti
• Kunnalliset sivustot. Mallia www.kankaanpaa.fi
Hakutuloksen arviointi
• Vastaako hakutulos alussa esitettyyn kysymykseen?
• Jos ei, miten hakua on muokattava – onko muutettava hakutekijöitä tai tekniikoita vai kenties tietolähdettä?
• Vastaako hakutulos tiedontarpeeseen – vai pitääkö hakukysymystä muokata ja jatkaa etsimistä?
Lähdekritiikki
• Vanhat lähdekritiikin periaatteet pätevät edelleen: Kuka kirjoittaa, miksi, milloin, miten kontrolloituna?
• Korostuvat verkossa, koska kuka tahansa voi kirjoittaa siellä mitä tahansa ja näyttää ulkoisesti melko uskottavalta
Auktoriteetti
• Auktoriteetti: kuka on tekstin takana?
• Voiko www-sivun osoitteesta nähdä kuka on tiedon takana
• Onko yhteystietoja, onko tiedon tuottaja asiantuntija tai viranomainen?
Sisältö
• Tekstin luonne: faktaa, mielipiteitä, propagandaa?
• Rajoitukset: Näkökulma, kattavuus, yksityiskohtaisuus?
• Luotettavuus: mihin teksti perustuu, miten se dokumentoidaan. Onko nootteja tai lähdeluettelo? Voidaanko tekstin tiedot varmentaa muista lähteistä?
Alkuperäisyys
• Mitä lähempänä tiedon alkulähdettä sen parempi – yleensä
• Mieluummin tilastotiedot tilastokeskuksesta kuin lehtijuttu niistä
• Mieluummin tieteellinen tutkimus kuin lehtijuttu tutkimuksesta
Tuoreus
• Milloin teksti on kirjoitettu ja julkaistu?
• Ovatko tiedot ajan tasalla?
• Kaikki tieto ei vanhene yhtä nopeasti
Sähköiseen aineistoon viittaaminen
• Jos tieto on asiallista ja laadukasta siihen voi hyvin viitata tutkielmissa
• Missä muodossa se tehdään vaihtelee eri aloilla
• Lisäongelmia: tiedon tuottajaa joskus hankala selvittää, nettitiedon pysyvyys on heikko, nettitiedon laatu vaihtelee rajusti
top related