Top Banner
metasearch • wat is het probleem bij de oplossing? • welke oplossing bij welk probleem?
21

Metasearch wat is het probleem bij de oplossing? welke oplossing bij welk probleem?

Jun 04, 2015

Download

Documents

Myriam Smit
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Page 1: Metasearch wat is het probleem bij de oplossing? welke oplossing bij welk probleem?

metasearch

• wat is het probleem bij de oplossing?

• welke oplossing bij welk probleem?

Page 2: Metasearch wat is het probleem bij de oplossing? welke oplossing bij welk probleem?

behoefte aan integreren van meer bronnen / zoeksystemen

waarom wil je dat voor je gebruikers?

• het is onhandig als ze dezelfde zoekvraag aan elk afzonderlijk systeem telkens weer opnieuw moeten stellen

• het is gebruikersonvriendelijk dat die systemen vaak allemaal verschillende zoekinterfaces hebben

© eric sieverts, UB Utrecht

Page 3: Metasearch wat is het probleem bij de oplossing? welke oplossing bij welk probleem?
Page 4: Metasearch wat is het probleem bij de oplossing? welke oplossing bij welk probleem?

behoefte aan integreren van meer bronnen / zoeksystemen

waarom wil je dat voor je gebruikers?

• het is onhandig als ze dezelfde zoekvraag aan elk afzonderlijk systeem telkens weer opnieuw moeten stellen

• het is gebruikersonvriendelijk dat die systemen vaak allemaal verschillende zoekinterfaces hebben

© eric sieverts, UB Utrecht

Page 5: Metasearch wat is het probleem bij de oplossing? welke oplossing bij welk probleem?
Page 6: Metasearch wat is het probleem bij de oplossing? welke oplossing bij welk probleem?

integreren van meer bronnen / zoeksystemen

globaal twee soorten aanpak:

• alle bronnen zelf in je eigen centrale systeem (zoekmachine) indexerende OMEGA-aanpak

• meta-zoeksysteem dat de bij de afzonderlijke bronnen behorende zoeksystemen in één keer parallel bevraagt (gedistribueerde zoekactie)de METALIB-aanpak

© eric sieverts, UB Utrecht

Page 7: Metasearch wat is het probleem bij de oplossing? welke oplossing bij welk probleem?

indexer

internet

tekstbestanden(metadata) tekstbestanden

centrale index

zoekengeïntegreerd systeemvia lokale centrale index

indexeer-regels voor

targets

full-text links

mega

Page 8: Metasearch wat is het probleem bij de oplossing? welke oplossing bij welk probleem?

eigen centrale index

voorbeelden:UB Utrecht - Omega-systeem• metadata van artikelen uit groot aantal

tijdschriften van diverse leveranciers

OAIster • via Open Archive protocol “ge-harveste”

metadata (volgens Dublin Core), uit ruim 400 “institutionele archieven” met wetenschappelijke publikaties

© eric sieverts, UB Utrecht

Page 9: Metasearch wat is het probleem bij de oplossing? welke oplossing bij welk probleem?

eigen centrale index

voordelen:

• garantie van uniforme zoekmogelijkheden

• geavanceerde zoekfunctionaliteit mogelijk, want we hebben zelf in de hand welke zoekmachine we kiezen en hoe we die configureren

nadelen:

• zwaar systeem (eigen zoekmachine) te hosten en beheren

• kan niet voor alle “content”© eric sieverts, UB Utrecht

Page 10: Metasearch wat is het probleem bij de oplossing? welke oplossing bij welk probleem?

wanneer eigen index ?

als je zelf beheer kunt krijgen over te doorzoeken “content”

– wel bij materiaal van (sommige / grote) uitgevers (zoals Elsevier, JStor, etc)

– niet bij materiaal van uitgevers die dat (nog) niet willen / kunnen / begrijpen

– niet bij databases waar bijbehorend zoek-systeem al verweven is met (de ontsluiting van) de gegevens (zoals Ovid, CSA, Pubmed, etc)

© eric sieverts, UB Utrecht

Page 11: Metasearch wat is het probleem bij de oplossing? welke oplossing bij welk probleem?

meta-search oplossing

daarvoor is nodig:

• het betreffende materiaal / content moet al een eigen zoeksysteem hebben

• dat zoeksysteem moet extern (via internet) te benaderen zijn

• met dat zoeksysteem moet via gestructureerde interactie gecommuniceerd kunnen worden (opdrachten versturen, antwoorden binnenhalen)

© eric sieverts, UB Utrecht

Page 12: Metasearch wat is het probleem bij de oplossing? welke oplossing bij welk probleem?

internet

zoekengeïntegreerd systeemvia meta-zoekmethode

index

be-stand

zoek

query-generator / antwoord-inzamelaar

index

be-stand

zoek

index

be-stand

zoek

index

be-stand

zoek

index

be-stand

zoek

index

be-stand

zoek

Z39.50

Z39.50 Z39.50

internapi

http http xml

Z39.50 http

configuratiegegevens

van targets

Page 13: Metasearch wat is het probleem bij de oplossing? welke oplossing bij welk probleem?

meta-search oplossing

metasearch software (zoals Metalib) kan communiceren met verschillende soorten zoeksystemen:

– Z39.50 protocol (vooral bibliografische databases)redelijk gestandaardiseerd, maar weinig geavanceerd

– interactie op basis van xml (o.a. nieuw SRU-protocol)redelijk flexibel, maar nog geen ruime ondersteuning

– http-protocol / web-formulieren ("screen-scraping")wijd verbreid, maar niet gestructureerd / weinig stabiel

– lokale “legacy”-systemen © eric sieverts, UB Utrecht

Page 14: Metasearch wat is het probleem bij de oplossing? welke oplossing bij welk probleem?

meta-search oplossing

voordelen:– geen zwaar eigen systeem te beheren

– ook geschikt voor niet zelf indexeerbare content

nadelen: – grootste gemene deler van zoekfunctionaliteit

– geen geavanceerde zoekfuncties beschikbaar

– soms ingewikkeld configuratie-werk (zowel voor Z39.50 als voor http:url-syntax en screen-scraping)

© eric sieverts, UB Utrecht

Page 15: Metasearch wat is het probleem bij de oplossing? welke oplossing bij welk probleem?

meta-search toepassingen UBU

wat we zelf niet makkelijk kunnen indexeren en wel een bijbehorend zoeksysteem heeft

– full-text tijdschriften die we (nog) niet in Omega-zoekmachine hebben kunnen krijgen

– bibliografische databases, catalogi etc. die we niet zelf kunnen indexeren én niet tot de eigen full-text collectie behoort (dus eigenlijk niet in Omega-zoeksysteem thuishoort)

© eric sieverts, UB Utrecht

Page 16: Metasearch wat is het probleem bij de oplossing? welke oplossing bij welk probleem?

meta-search bij Omega

uitgevers die (nog) geen metadata leveren

mogelijke problemen:

– meestal web-interfaces die configuratie met screen-scraping nodig maken

– meeste waarschijnlijk (nog) niet standaard ondersteund door Metalib (ExLibris)

© eric sieverts, UB Utrecht

Page 17: Metasearch wat is het probleem bij de oplossing? welke oplossing bij welk probleem?

bibliografische meta-search

al die verschillende niet-fulltext zoeksystemen

mogelijke problemen bij Metalib:

– veel “native” interfaces bieden veel betere / geavanceerder zoekmogelijkheden

– niet meer dan 10 tegelijk doorzoekbaar te maken– samenvoegen van op relevantie geordende

zoekresultaten geeft problemen– nog niet allemaal standaard ondersteund door

Metalib– …..

© eric sieverts, UB Utrecht

Page 18: Metasearch wat is het probleem bij de oplossing? welke oplossing bij welk probleem?

mogelijke scenario’s voor toepassen van meta-search

scenario 1:

we bieden gebruikers twee systemen:

– metasearch systeem dat alle bibliografische bronnen tegelijk doorzoekbaar maakt (in groepjes van maximaal 10)

– Omega-systeem dat alle full-text materiaal tegelijk doorzoekbaar maakt via:Omega-zoekmachine + metasearch van “overige” uitgevers

© eric sieverts, UB Utrecht

Page 19: Metasearch wat is het probleem bij de oplossing? welke oplossing bij welk probleem?

internet

“biblio”metasearch

scenario 1

index

Aleph

zoek

index

biblograf.

zoek

index

ncc

zoek

index

bibliograf.

zoek

index

fulltext

zoek

index

fulltext

zoek

omegaindex

“full-text”metasearch

omegazoekmach.

bibliografisch zoeken omega zoeken

full-textzoeken

Page 20: Metasearch wat is het probleem bij de oplossing? welke oplossing bij welk probleem?

mogelijke scenario’s voor toepassen van meta-search

scenario 2:

we bieden gebruikers één systeem:

– systeem dat “alles” tegelijk doorzoekbaar maakt via metasearch (opgedeeld in groepjes van maximaal 10)

daarónder native interfaces van alle individuele systemen; daarbij behalve Pubmed, Psycinfo, catalogus enz., óók Omega dat alle full-text materiaal tegelijk doorzoekbaar maakt

© eric sieverts, UB Utrecht

Page 21: Metasearch wat is het probleem bij de oplossing? welke oplossing bij welk probleem?

internet

“alles”metasearch

scenario 2

index

Aleph

zoek

index

biblograf.

zoek

index

ncc

zoek

index

bibliograf.

zoek

index

fulltext

zoek

index

fulltext

zoek

omegaindex

“full-text”metasearch

omegazoekmach.

alles zoekenomega

full-text zoeken

index

bibliograf.

zoek

pubmed

catalogus