Top Banner
Statistický modul EZproxy a další aktuální vývoj MULTIDATA Praha Mgr. Petr Novák Knihovna psychologie FF UK 6.října 2009
34

EZproxy Seminar Multidata

Apr 16, 2017

Download

Technology

Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Page 1: EZproxy Seminar Multidata

Statistický modul EZproxy a další aktuální vývoj MULTIDATA Praha Mgr. Petr NovákKnihovna psychologie FF UK6.října 2009

Page 2: EZproxy Seminar Multidata

Proč statistický modul?

OCLC (výrobce EZproxy) nabízí výčet různých nástrojů, komerčníchi freeware / OSS

Neposkytují podporu pro skupiny Neposkytují podporu pro různé způsoby

autentizace zdlouhavá práce s logy na pracovní stanici limity, nelze pracovat v dávkách

Page 3: EZproxy Seminar Multidata

Statistický modul Autor RNDr. Vladimír Pávek Využívá XSLT procesor Saxon Vyžaduje Java Virtual Machine Otestováno na Windows 2003 server a Linux Testovací demo ke stažení z www.multidata.cz Konfigurace = editace XML souborů práce přímo na serveru EZproxy Generuje výstupy v ČJ a AJ

Page 4: EZproxy Seminar Multidata

Skupiny v EZproxy

Jsou využívány: pro korektní autorizaci uživatelů dle součásti

instituce (fakulty a základní součásti na VŠ, zaměstnanci x čtenáři x testeři ve všech knihovnách)

pro generování log souborů využívaných pro statistický modul

předávány jsou různé kombinace skupin

Page 5: EZproxy Seminar Multidata

Jak EZproxy ukládá logy Konfigurace v config.txt Ukládání v týdenních intervalech 2 druhy logů:

LogSPU -> spu%Y-%W.log= výchozí URL zdroje

Hlavní log -> ezp%Y-%W.log= kompletní komunikace uživatel-zdroj bez *.jpg a *.gif

Page 6: EZproxy Seminar Multidata

Jak EZproxy ukládá logy - co se loguje IP adresa, uživatelské jméno, výčet skupin uživatele oddělený „+“, identifikátor session, datum a čas, kompletní HTTP request (např. GET

http://www.database.com HTTP/1.0), číslelný status HTTP žádosti (200 aj.), přenesená data v bajtech, (v případě hlavního logu ještě user-agent)

Page 7: EZproxy Seminar Multidata

Ukázka SPU logu 70.108.162.87 johndoe Default+UNI+MEDICINE+Student

a05db43a-6c0b-40d6-b0ff-2502eddb337d [10/Aug/2009:01:37:13 +0100] "GET http://ezproxy.library.edu/login/ovid HTTP/1.1" 200 0

18.18.162.117 marysmith Default+UNI+LAW+Student

e87bd19a-677a-41a1-bcb8-4309a4818e84 [10/Aug/2009:01:37:13 +0100] "GET http://ovidsp.ovid.com/ovidweb.cgi HTTP/1.1" 200 0

60.133.100.17 billking Default+UNI+ARTS+THEOLOGY+Student+Staff

94b62205-6564-47a4-97e0-e6497f2b8546 [10/Aug/2009:01:58:55 +0100] "GET http://ezproxy.library.edu/login/ebsco HTTP/1.1" 200 0

90.177.148.39 mikelee Default+UNI+ARTS+MATH+Staff

476663da-d3ac-42c1-a07b-1131fb1c01e8 [10/Aug/2009:01:58:55 +0100] "GET http://search.ebscohost.com/login.aspx?authtype=id HTTP/1.1" 200 0

58.128.110.30 tracylong Default+UNI+COMPSCI+Student

6ea828af-6c11-4f66-90ae-093be1d73026 [10/Aug/2009:03:35:11 +0100] "GET http://www.computer.org/portal/site/usdl HTTP/1.1" 200 0

Page 8: EZproxy Seminar Multidata

Způsoby zpřístupnění elektronických inf. zdrojů Autentizace na IP adresu (poskytovatel

zdroje zařadí IP adresu EZproxy serveru na seznam povolených IP adres) = typ 1

Autentizace jménem a heslem (poskytovatel zdroje zašle autentizační data - uživ.jméno a heslo -, ta jsou zadána do EZproxy a uživatel se jimi transparentně autentizuje vůči skrytému formuláři = typ 2

Page 9: EZproxy Seminar Multidata

Ukázka SPU logu 70.108.162.87 johndoe Default+UNI+MEDICINE+Student

a05db43a-6c0b-40d6-b0ff-2502eddb337d [10/Aug/2009:01:37:13 +0100] "GET http://ezproxy.library.edu/login/ovid HTTP/1.1" 200 0

18.18.162.117 marysmith Default+UNI+LAW+Student

e87bd19a-677a-41a1-bcb8-4309a4818e84 [10/Aug/2009:01:37:13 +0100] "GET http://ovidsp.ovid.com/ovidweb.cgi HTTP/1.1" 200 0

60.133.100.17 billking Default+UNI+ARTS+THEOLOGY+Student+Staff

94b62205-6564-47a4-97e0-e6497f2b8546 [10/Aug/2009:01:58:55 +0100] "GET http://ezproxy.library.edu/login/ebsco HTTP/1.1" 200 0

90.177.148.39 mikelee Default+UNI+ARTS+MATH+Staff

476663da-d3ac-42c1-a07b-1131fb1c01e8 [10/Aug/2009:01:58:55 +0100] "GET http://search.ebscohost.com/login.aspx?authtype=id HTTP/1.1" 200 0

58.128.110.30 tracylong Default+UNI+COMPSCI+Student

6ea828af-6c11-4f66-90ae-093be1d73026 [10/Aug/2009:03:35:11 +0100] "GET http://www.computer.org/portal/site/usdl HTTP/1.1" 200 0

typ 1typ 1 typ 2typ 2

Page 10: EZproxy Seminar Multidata

Rozdíl v logování

SPU log – srovnatelně zaznamená jak typ 1 (autentizace IP adresou), tak typ 2 (autentizace jménem a heslem)

Hlavní log - zaznamená kompletní komunikaci EZproxy se zdrojem dle typu 1, avšak pouhé otevření zdroje typu 2

-> jako zdroj pro statistiky využívanosti se hodí spíše SPU log, Hlavní log má doplňkovou funkci

Page 11: EZproxy Seminar Multidata

Workflow práce se statistickým modulem – generování HTML výstupů Realizováno každý týden

Nakopírování čerstvého souboru LogSPU do /statistika (adresář se statistickým modulem)

Spuštění dávky Nakopírování výstupních HTML souborů do

požadované lokace – např. /docs/public (do této lokace lze obecně umístit jakékoli HTML a grafické soubory ke kterým není třeba ověřovat přístup)

Kontrola errorlog.html

Page 12: EZproxy Seminar Multidata
Page 13: EZproxy Seminar Multidata
Page 14: EZproxy Seminar Multidata

Workflow práce se statistickým modulem - tit-url.xml Editace souboru tit-url.xml tit-url.xml obsahuje seznam zdrojů včetně URL a

výčtu přiřazených skupin Vždy při přidání nového zdroje Konvence pojmenování zdroje Pokud zdroj již není předplácen – nutno

konfiguraci v tit-url ponechat Ukázka záznamu

Page 15: EZproxy Seminar Multidata
Page 16: EZproxy Seminar Multidata

Workflow práce se statistickým modulem – analýza chybových URL soubor errorlog.html slouží k nalezení chybných konfigurací v tit-

url.xml

Page 17: EZproxy Seminar Multidata

Statistika dle zdrojů a měsíců pro celou knihovnu

Page 18: EZproxy Seminar Multidata

K čemu může sloužit

Statistika dle zdrojů a měsíců pro celou knihovnupro jednotlivé skupiny

Využití pro marketing:sledování krátkodobých přístupů (trialy)meziměsíční změnycelkové úhrny

Page 19: EZproxy Seminar Multidata

Statistika dle skupin

Page 20: EZproxy Seminar Multidata

K čemu může sloužit

Statistika dle skupin pro celou knihovnu pro jednotlivé skupiny

Využití pro marketing: rozdíly mezi jednotlivými skupinami (fakultami) zdroj pro přepočet dle počtu reálných uživatelů

(studenti + akademičtí pracovníci, všichni čtenáři / aktivní uživatelé vzdáleného přístupu)

Page 21: EZproxy Seminar Multidata
Page 22: EZproxy Seminar Multidata

K čemu může sloužit

Statistika dle skupin a dle zdrojůpro jednotlivé skupiny

Využití pro marketing:rozdíly mezi jednotlivými skupinami

(fakultami) pro konkrétní zdrojezdroj pro analýzu využívanosti zdrojů ->

podklad pro akvizici

Page 23: EZproxy Seminar Multidata

Další práce s výstupy v Excelu

Všechny prezentované tabulky lze z HTML přes schránku snadno metodou CTRL+C, CTRL+V zkopírovat do Excelu a dále zpracovávat

Výstup např. do CSV se ukázal jako zbytečný

Page 24: EZproxy Seminar Multidata

K nabídce statistického modulu

Dodávka zahrnuje budoucí aktualizace Cena mírná , na dotázání

Dotazy ke statistickému modulu?

Page 25: EZproxy Seminar Multidata

Čas na švestkovou buchtu

Page 26: EZproxy Seminar Multidata

Autentizační modul možnosti autentizace a autorizace EZproxy: built-in by OCLC

:-) textový soubor s hesly LDAP

LDAP dle RFC 2307 (např. OpenLDAP) Active Directory, eDirectory

Shibboleth doména Windows pro ČR exotické knihovní systémy – Voyager, III, …

více viz http://www.oclc.org/us/en/support/documentation/ezproxy/usr/default.htm

Page 27: EZproxy Seminar Multidata

ALEPH...? Nativní podpora autentizace a autorizace

uživatelů EZproxy v systému ALEPH chybí Akademické knihovny disponují LDAP adresáři

pro autentizaci k různým informačním procesům v rámci svých informačních systémů

Veřejné a vědecké knihovny LDAP podporu pro čtenáře nemívají

->>> potřeba autentizačního modulu

Page 28: EZproxy Seminar Multidata

Autentizační modul

Autoři Jiří Rataj Lukáš Hlůže Martin Vojnar

testován na EZproxy serveru draco.multidata.cz

Page 29: EZproxy Seminar Multidata
Page 30: EZproxy Seminar Multidata

Výhoda řešení standardizované LDAP rozhraní podporující

EZproxy Shibboleth Identity Provider libovolné další služby (tiskové fronty, autentizace pracovních

stanic, …) aktuální data via LDAP – např.

účet aktivní ihned po vystavení průkazky účet odblokován okamžitě po uhrazení pokuty lze stanovit specifickou skupinu uživatelů pro vzdálený přístup

(nikoli nutně všichni registrovaní čtenáři)

Page 31: EZproxy Seminar Multidata

Podrobnosti možné zabezpečení komunikace

EZproxy-LDAP: SSL (ldaps) + fixní IP adresa LDAP-mezivrstva-ALEPH: omezení jen pro localhost komunikaci,

pokud nebude LDAP a ALEPH na jednom serveru – lze implementovat https + fixní IP adresu

propustnost v řádu desítek autentizačních dotazů za minutu mezivrstva LDAP – ALEPH je napsána v perlu vyžaduje ALEPH v.18 a vyšší

s licencí X-services

Page 32: EZproxy Seminar Multidata

Obsah datagramu mezivrstvy<?xml version="1.0" encoding="UTF-8"?><bor-auth><bor-id>carovy_kod_uzivatele</bor-id><bor-uid>primarni_id_uzivatele</bor-uid><bor-name>jmeno_uzivatele</bor-name><bor-email>email_uzivatele</bor-email><bor-lang>jazyk_komunikace_s_uzivatelem</bor-lang><bor-auth-ok>vysledek_verifikace</bor-auth-ok><bor-credit>stav_penezniho_uctu</bor-credit><bor-status>kategorie_uzivatele</bor-status><error>textova_zprava_o_vysledku_verifikace_v_pripade_chyby

</error></bor-auth>

Page 33: EZproxy Seminar Multidata

Ukázka http://boa.ruk.cuni.cz:8991 ldapsearch -x -D

'uid=333,ou=EZPROXY,dc=ruk,dc=cuni,dc=cz' -W -v -h boa.ruk.cuni.cz -b 'uid=333,ou=EZPROXY,dc=ruk,dc=cuni,dc=cz' uid=333,ou=ezproxy,dc=ruk,dc=cuni,dc=cz

boa.ruk.cuni.cz ou=EZPROXY,dc=ruk,dc=cuni,dc=cz(objectClass=p

erson) uid 333

Page 34: EZproxy Seminar Multidata

Vaše dotazy a komentáře…

… za které děkuji

[email protected]