Top Banner
Czy OPAC ulegną destrukcji? Linked Data w pracy bibliotekarza Dr hab. Marek Nahotko, Uniwersytet Jagielloński Spotkanie użytkowników Nukat, Warszawa 5.12.2014
25

Nukat2014

Jul 14, 2015

Download

Internet

Marek Nahotko
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Page 1: Nukat2014

Czy OPAC ulegną destrukcji?

Linked Data w pracy bibliotekarza

Dr hab. Marek Nahotko, Uniwersytet Jagielloński

Spotkanie użytkowników Nukat,

Warszawa 5.12.2014

Page 2: Nukat2014

Cechy środowiska informacyjnego

Biblioteki utraciły dawny monopol na tworzenie

katalogów – zbiorów metadanych;

Każdy może stworzyć własny katalog; kiedyś ze

względu na mały zasięg nie miało to znaczenia,

teraz może on być dostępny na cały świat;

Wiele serwisów korzysta z pracy bibliotekarzy,

budując konkurencyjne narzędzia;

Dane biblioteczne zamknięte są w „silosach”, z

możliwością wejścia tylko przez OPAC i bez

połączeń ze światem zewnętrznym;

Jak funkcjonować w tak skomplikowanej sytuacji?

2

Page 3: Nukat2014

Teoria tekstu Gerarda Genette

3

Obok tekstu autorskiego istnieją także teksty go otaczające (parateksty), zarówno w obrębie książki (peritekst), jak i poza nią (epitekst);

Może to być: tytuł, podtytuł, pseudonim, wstęp, dedykacje, uwagi, epilog, również korespondencja autora, dzienniki, wywiady, ilustracje, preteksty…

Ich zadaniem jest mediacja tekstu do użytkownika, wskazują na kierunki interpretacji tekstu;

Paratekst to również tekst, należący do różnych gatunków;

Bibliotekarz posługuje się tekstem i peritekstem (czasem również epitekstem) dla stworzenia epitekstu (tekstu gatunku opisu bibliograficznego);

Katalog(i) można traktować jako gatunek paratekstu.

Page 4: Nukat2014

Opis bibliograficzny w teorii tekstu

4

Katalogowanie, jako tworzenie reprezentacji tekstu, jest typizowanym działaniem retorycznym, wykonywanym w powtarzalnych sytuacjach (definicja gatunku tekstu);

Katalogujący tworzy odrębnego rodzaju stwierdzenia/wypowiedzi/teksty: reprezentacje dokumentów; staje się więc autorem odpowiedzialnym za treść tych reprezentacji;

W ten sposób biblioteki, katalogi i bibliografie mogą być traktowane jako gatunki komunikacyjne, służące wspomaganiu publikowania i dokumentowania;

Katalogowanie i wyszukiwanie, jako część organizacji informacji, są aktywnościami równie złożonymi jak tworzenie i odbiór tekstów dokumentów; niezbędna wiedza gatunkowa w obu przypadkach jest taka sama.

Page 5: Nukat2014

Teksty i parateksty a technologie Sieci

5

Technologia Teksty Gatunki

tekstów

Gatunki

biblioteczne

Innowacja

Web 1.0 zamknięte tradycyjne OPAC mała

Web 2.0 otwarte nowe (np. blogi) OPAC 2.0,

SOPAC

większa

Web 3.0, SW kodowana

semantyka

automatyzacja? LOD,

Discovery?

destrukcyjna?

Page 6: Nukat2014

Współdziałanie (interoperability)

Oznacza uzgadnianie wiedzy gatunkowej twórców (i odbiorców) tekstu metadanych;

Zdolność dwóch lub więcej systemów lub ich części pracujących na różnym sprzęcie i oprogramowaniu, o różnych strukturach danych i interfejsach, do wymiany danych [głównie tekstów] z minimalną utratą treści i funkcjonalności (NISO);

Współdziałanie metadanych jest częścią znacznie większego problemu współdziałania systemów;

K. Subieta: dziedzina badawcza i praktyczna zajmująca się umożliwieniem współpracy niezależnie zbudowanych (heterogenicznych) systemów, szczególnie w sieciach komputerowych.

6

Page 7: Nukat2014

Poziomy współdziałania systemów Manso-Callejo i in.:

Techniczne: bity i bajty, pliki, przetwarzanie,

protokoły;

Syntaktyczne: wspólne formaty, struktury, języki;

Semantyczne: wspólne słowniki terminów;

Pragmatyczne: metody i procedury;

Dynamiczne: nadzór transferu danych;

Konceptualne: modelowanie systemu i danych;

Organizacyjne: cele biznesowe, polityka dostępu,

procesy, wzorce postępowania.

7

Page 8: Nukat2014

Poziomy uzgadniania wiedzy gatunkowej

(współdziałania metadanych) (Weibel)

Semantyka tekstu opisu:

Uzgodnione znaczenie elementów metadanych.

Struktura (czyli pragmatyka):

Rekordy, powtarzalność danych, konstrukcja nazw,

zasady i przepisy tworzenia wartości elementów (np. dat),

słowniki… czyli parateksty tekstu opisu bibliograficznego,

Czytelna dla człowieka, przetwarzalna dla maszyny.

Syntaktyka:

Reguły gramatyczne dla zapisu semantyki i pragmatyki

oraz ich kodowania, przesyłania i rozkodowywania.

8

Page 9: Nukat2014

Standaryzacja metadanych

9

Page 10: Nukat2014

Sposoby uzyskiwania współdziałania (Chan&Zeng)

10

INNOWACJA!

Page 11: Nukat2014

Nowa innowacyjna technologia

współdziałania – Linked (Open) Data (LOD)

11

Konieczność zmian w dwóch obszarach:

Treści: otwarte dane,

Systemy: linkowanie danych, tworzące Semantyczny

Web

Cele bibliotek związane z LOD:

Udostępnienie własnych danych jako LOD dla innych,

Pobieranie i wykorzystanie LOD z innych zasobów dla

wzbogacenia własnych danych,

Stosowanie LOD w celu stworzenia całkowicie nowej,

niezależnej od dotychczasowych dostawców,

Infrastruktury Webowej jako podstawy katalogowania (cel

BIBFRAME).

Page 12: Nukat2014

Linked Data

Technologia ta dotyczy wszystkich gatunków

paratekstu, tworzonego w bibliotekach;

Słowniki udostępniane w Web w formie czytelnej dla

komputerów;

Dwa rodzaje słowników (składniki):

Semantyka metadanych: słowniki będące wykazami

elementów metadanych (pól i podpól rekordu),

Pragmatyka metadanych: słowniki kontrolowane,

zawierające wartości metadanych.

12

Page 13: Nukat2014

Słowniki: MACS w LOD

13

Page 14: Nukat2014

Technologie Linked Data

14

Dane łączone odnośnikami URI (trójki RDF):

SPARQL – język zapytań, standard służący

wyszukiwaniu danych kodowanych jako trójki RDF:

skomplikowany i trudny w użyciu.

Page 15: Nukat2014

Przykładowe trójki RDF

15

Page 16: Nukat2014

Istota zmian

16

W LOD semantyka metadanych oddzielona jest od

ich syntaktyki, dzięki czemu zmiana struktur nie

powoduje zmiany znaczenia;

Zarówno elementy semantyki jak i pragmatyki

kodowane są przy pomocy tej samej syntaktyki

(XML/RDF) i są czytelne maszynowo;

Dzięki temu struktury danych (MARC, DC…) i inne

słowniki (jiw, khw) stają się ontologiami

umieszczonymi w chmurze danych.

Page 17: Nukat2014

Współdziałanie w LOD

17

Page 18: Nukat2014

Dwa rodzaje współdziałania

18

Page 19: Nukat2014

Rekord metadanych (paratekst) LOD

19

Page 20: Nukat2014

Korzyści

20

Nowe perspektywy dla rozproszonego współkatalogowania: ujednolicenie wiedzy gatunkowej;

Ujednolicenie wiedzy (globalny standard) pozwalające na: Wzrost możliwości wyszukiwawczych,

Optymalizację wykorzystania istniejących danych,

Wzrost współdziałania,

Elastyczny model danych,

Łatwiejszą integrację danych bibliotecznych w serwisach społecznościowych,

Lepsze wykorzystanie danych bibliotecznych przez wyszukiwarki.

Page 21: Nukat2014

BIBFRAME – słownik nadrzędny

21

Page 22: Nukat2014

Zastosowania biblioteczne

22

Page 23: Nukat2014

Efekt - innowacja destrukcyjna?

23

Koncepcja Claytona Christensena, ekonomisty (2008): niszczące innowacje

Innowacja: połączenie nowej technologii i bardziej efektywnego modelu ekonomicznego;

W wyniku innowacji produkt staje się prostszy i bardziej dostępny;

Niszczący wpływ na istniejący rynek.

Koncepcja Fostera i Kaplana (2003): twórcza destrukcja

Do rozpowszechnienia innowacji potrzebne zmiany: kultury i instytucji społeczeństwa, firm i czynników wpływających na proces produkcji.

Page 24: Nukat2014

Innowacje destrukcyjne

24

Page 25: Nukat2014

Dziękuję za uwagę!

[email protected] 25