Múzeumi adatok gépi kezelése, konverziós tapasztalatok Lengyel Monika 2014.04.23.
Múzeumi adatok gépi kezelése, konverziós tapasztalatok
Lengyel Monika2014.04.23.
Konverziós tapasztalat
•Szabványos adat csereformátummal rendelkező rendszerek migrációja:Aleph, Corvina, OLIB, SrLib, SLIB, QTéka, Textlib, Horizon, Kistéka, Alice, Alephino, Szikla
•Nem szabványos rendszerek adattartalmának migrációja: ISIS, Textár, PClib, Access, TINLIB, TSERIES (román), DrLib, Orbis, Leonardo, NanLib, ELKA, Szirén, Ariadne / Monari, Lapoda, Access adatbázisok, excel / word táblák, valamint egyedi fejlesztésű sql adatbázisok visszafejtése.
=> (Bármilyen strukturált adatot fogadunk)•Kaposvári Megyei Könyvtár, Széchényi Egyetem könyvtára, VÁTI, Miskolci Egyetem Könyvtára, PIM, Corvinus Egyetem Központi Könyvtára, OIK, Kisfaludy Károly Megyei Könyvtár, KELLO, "Nagy Könyv" Iroda, Kolozsvári Megyei könyvtár, Marosvásárhelyi megyei könyvtár•„Bérkonverzió” - nem szabványos rendszerek adatainak szabványossá konvertálása a konkurens partnereink számára •Több millió bibliográfiai rekord, több százezer authorithy rekord
Múzeumi konverziók
PIM – MS Access (26 db)Skanzen (Athena projekt) – Monari adatátadásZalai Megyei Göcsej Múzeum – DEPO (10 külön adatbázissal)Hanság Múzeum - DataeaseHagyományok Háza - LapodaBékéscsabai Munkácsy Múzeum – LapodaMNM – és filiái - aggregáció
MunyirDataeaseExcell (europeana anyaga)Ariadne
Hadtörténeti Múzeum Excel (Fotótár, éremtár, képeslap, lőfegyver)
Migráció címszavakban
•karakterkészletek, karakterkonverzió•Valamiből kiindulva – (MARC)XML formátumban•Authorithy és háttérállományok (kiegészítő adatok, struktúrák) – tárgyszavak, gyűjtemény hierachiák, mozgatási információ•rekordkapcsolatok, kapcsolt rekordok•Eredeti rekordazonosító megőrzése (id, sorszám stb.)•Veszteségmentes konverzió – csak pótolható adatot ismerünk!
Adattisztítás
•MINDEN áttöltés együtt jár adattisztítással – felületi eszközök•Mélyebb problémák megoldása a Huntéka adatszerkezetében rejlik: adatbázisban modellezett marc tárolás:
•almező szintű szegmentáltság + rekord azonosítók őrzése
•Gyakorlatilag mindenféle formátumot tudunk szolgáltatni.MNM aggregáció:
Munyir – Dataease azonosságok kezelése, összefésüléseIdőszalagos kereséshez – átalakítások
Göcsej MúzeumElveszett mozgatási információ utólagos pótlása a 10 féle adatbázisból
Konkrét megvalósítás: Museumap
•9 résztvevő múzeum•Építőkockáink:
Excel táblákWord táblázatokDEPO Ariadné változatok MunyirDataese
Hozott anyagból…
MNM : 337132 t / 20751 kép1. Munyir 212406 t.2. Dataese 88160 t.3. Excel (5 db)35449 (europeana)
TSM: 7376 tEcxel (3db)
GÖCSEJI M: 10185310 DEPO adatbázis
BI Muzeum (Nyirbátor) 33071 t.1. Aridané A, B 2. word(!) táblázat ca 18 ezer
VÁ Múzeum (Vaja) ca 1300 t.Ariadné
MK Muzeum (Visegrád) 11500 t.Excel táblázatok (6 db)Word fájl
BB Vármúzeum (Esztergom) 50700 tExcel táblák
Speciális migrációs problémák
•excel világ <-> adatbázisok rendezett világa •Külön vezetett leltárkönyvek•Szabványos leírások hiánya•Besorolási adatállomány fogalma•Vizuális papírra emlékeztető megoldások
Nem szúr szemet egy excel-ben:
Hokkal és apró kaviccsal is erősen soványított - durva felület Hommakal erősen - érdes felületet képez, apró kaviccsal Hommakal erősen - érdes felületet képez, apró kaviccsal, apró mészszemcsék Hommakal erősen - érdes felületet képez, apró kaviccsal, mészszemcsék Hommakal erősen és apró kaviccsal is erősen soványított Hommakal erősen és apró kaviccsal is nagyon erősen soványított, szinte több benne a soványítóanyag, mint az agyag Hommak elrősen - érdes felületet képez, apró kaviccsal
Korongolt/ Utánkorongolt Utánkorongolt Utánkorongolt? Utánkrorngolt? kézi korogon Kézi korongolt kézi korongon és kézzel formált kézi korongon v korongon készült kézzi koronggal formált
Látványos táblázatok
Látványos táblázatok
Látványos táblázatok
Látványos táblázatok
Adatkör - feltártság
Általánostól az egyediig - megnevezések
Általános tapasztalatok
• Szabványok hiánya fájdalmas • Vegyesen használt mezők sokasága • Mit szabad és mit nem? • Az eredmény: „sok hűhó semmiért”• Sok duplum tétel• Szegényes leírások - képek hiánya
Mások is így kezdték!
Köszönöm a figyelmet!