MASA MOM Lyon 2018 OpenArchaeo Jeux de données archéologiques dans le web sémantique Xavier Rodier & Olivier Marlet Consortium MASA Maison de Sciences de l’Homme Val de Loire Laboratoire Archéologie et Territoires UMR 7324 CITERES CAA2014 PARIS
MASA
MOM
Lyon
2018
OpenArchaeo
Jeux de données archéologiques
dans le web sémantique
Xavier Rodier & Olivier Marlet
Consortium MASA
Maison de Sciences de l’Homme Val de Loire
Laboratoire Archéologie et Territoires UMR 7324 CITERES
CAA2014
PARIS
MASA
MOM
Lyon
2018
Le consortium MASA« Mémoire des archéologues et des sites archéologiques »
• la Maison des Sciences de l’Homme du Val de Loire
• la Maison de la Recherche en Sciences Humaines de Caen
• la Maison de l’Orient et de la Méditerranée de Lyon
• la Maison Méditerranéenne des Sciences de l’Homme, d’Aix-en-Provence
• la Maison Archéologie & Ethnologie de Nanterre
• le Musée d’archéologie nationale de Saint Germain-en-Laye
• le Groupement de Services Frantiq
• l’INRAP (depuis le 1er janvier 2017)
MASA
MOM
Lyon
2018
Les données archéologiques
Accumulation des archives
Volonté de structurer et de publier ces données
Multiplication des bases de données et hétérogénéité des formats
Nécessité de mettre en place des bonnes pratiques :
- métadonnées normalisées et archivage pérenne
- mise en ligne des données
- alignement sur des vocabulaires normalisés
- interopérabilité des données
- alimentation des plateformes
MASA
MOM
Lyon
2018
Les données archéologiques dans le
Linked Open DataA
rch
ivin
g
Use and reuse
Vocabulary alignment
Publications
Interoperability
Ontology
MASA
MOM
Lyon
2018
The FAIR Data Principles
MASA
MOM
Lyon
2018
Métadonnées et archivage
• Identification avec numéro ARK
• Mise en place de métadonnées en EAD
• Référencement avec Nakala (Huma-Num)
MASA
MOM
Lyon
2018
Publication de données
MASA
MOM
Lyon
2018
Vocabulaire normalisé : les PACTOLS
MASA
MOM
Lyon
2018
Interopérabilité des données
• Réaliser les appariements de chaque source de
données avec le CIDOC-CRM et ses extensions.
• Mettre en place une application unique pour
interroger ces sources de données hétérogènes.
MASA
MOM
Lyon
2018
Réutilisation des données
MASA
MOM
Lyon
2018
Evaluation des jeux de données (CITERES-LAT)
Data set Format 5 stars Linked
Open Data FAIR Start date Web
ArSol 4D *****
1990 http://arsol.univ-tours.fr/
Atlas Archéologique
de Touraine postgreSQL *****
2006 http://a2t.univ-tours.fr/
Iceramm mySQL *****
2007 http://iceramm.univ-tours.fr/
Toposources mySQL *****
2012 http://toposources.univ-tours.fr/
Outillage de la Gaule antique
XML *****
2016 http://outagr.huma-num.fr
Rigny XML *****
2016 (work in progress)
AERBA XML *****
2017 (work in progress)
MASA
MOM
Lyon
2018
ArSol : « Archives du Sol »• Enregistrement archéologique de terrain 1990
• 4D (logiciel propriétaire)
• Données en ligne : http://arsol.univ-tours.fr
• Utilisation de ce cas particulier pour évaluer
l’interopérabilité au sein de MASA
MASA
MOM
Lyon
2018
Ap
par
iem
ent
des
ch
amp
s d
e la
tab
le "
Sép
ult
ure
"
MASA
MOM
Lyon
2018
Utiliser Ontop
• Protégé, logiciel d’ontology
• CIDOC au format OWL
• Charger les extensions CRM
• Explorer l’arborescence
• Connecter la base de données
• Ecrire les mappings
• Générer un fichier RDF
MASA
MOM
Lyon
2018
Requête SPARQL
• Interrogation dynamique
d’une base de données en
ligne, à partir des entités du
CIDOC
• Qui serait prêt à utiliser une
interface aussi peu
conviviale ?
MASA
MOM
Lyon
2018
Progression pour ArSol
• En ligne
• Données structurées
• Format libre
• standard W3C
• Interopérable
Faut-il migrer les données dans un format ouvert et standard,
alors que les données sont interopérables ?
MASA
MOM
Lyon
2018
Atlas des établissements ruraux de la Beauce antique
Inventaire des sites ruraux de Beauce connus par prospections aériennes et pédestres
MASA
MOM
Lyon
2018
Appariement des données XML d’AERBA avec le CIDOC
MASA
MOM
Lyon
2018
3M
MASA
MOM
Lyon
2018
Progression pour AERBA
• En ligne
• Données structurées
• Format libre
• standard W3C
• Interopérable
Le seul fait de choisir le format XML permet d’avancer vite vers l’interopérabilité.
Les nouveaux projets demandent moins de travail que l’actualisation des anciens.
MASA
MOM
Lyon
2018
Rigny: The perspective of consultation
• too many publications
• not enough time to read everything
• required selection of readings
• we do not read, we consult
but we still write in the same way…
Is it possible to reconcile both speed-
reading and in-depth consultation in
the same publication?
MASA
MOM
Lyon
2018
The archaeological excavation of Rigny
• Indre-et-Loire (France), from 1986 to 1999
• Retrace the formation and transformations
of a parish centre
• Study the population buried in the cemetery
• Occupation from 7th to 19th century
• Computerization since 1990 in ArSol Database
• Training excavation for students in archaeology at the University of Tours since 1989
MASA
MOM
Lyon
2018
The logicism programme of Gardin
Paris, 1979
Cambridge University
Press, 1980
From the outset, a twofold objective:
1. of an epistemological nature:
clarify the mechanisms and foundations of the
reasoning used in archaeological constructions
2. of an editorial nature:
reduce the imbalance between the flood of
publications and our capacities of assimilation, to
solve the problem of scientific overproduction
MASA
MOM
Lyon
2018
• The argumentation is a series of inference operations from the initial propositions {P0}
(basic data) to the final interpretative propositions {Pn}
MASA
MOM
Lyon
2018
Application to an electronic publication
• Logicism aims to make the steps of reasoning explicit by removing the cognitive
construction from its rhetorical packaging
MASA
MOM
Lyon
2018
Access to field data
In-depth examination of the evidence
MASA
MOM
Lyon
2018
From field recording to logicist publication
MASA
MOM
Lyon
2018
The architecture of the publication
MASA
MOM
Lyon
2018
Logicist diagrams in the publication
Diagrams provide a synoptic representation of the argumentation and allow a quick
assessment of its validity
MASA
MOM
Lyon
2018
Helping building logicist trees
MASA
MOM
Lyon
2018
Another work in progress
• medieval and modern ceramics
• material evidence from 40 sites
online DB
MASA
MOM
Lyon
2018Towards semantic interoperability
MASA
MOM
Lyon
2018
Typologies of propositions
MASA
MOM
Lyon
2018
Mapping with CRMinf
Observation data or comparison data
• S15_Observable_Entity → O11_was_described_by → S6_Data_evaluation (IsA
I5_Inference_Making IsA I1_Argumentation) → J2_conclued_that → I2_Belief → J4_that →
I4_Proposition_Set
• I5_Inference_Making → J3_applies → I3_Inference_Logic
Reference data
• E31_Document (IsA E73_Information_Object) → J7_is_evidence_for → I7_Belief_Adoption (IsA
I1_Argumentation) → J6_adopted → I2_Belief → J4_that → I4_Proposition_Set
Intermediate proposition
• I4_Proposition_Set → J4_is_subject_of → I2_Belief → J1_was_premise_for →
S8_Categorical_hypothesis_building (IsA I5_Inference_Making IsA I1_Argumentation) →
J2_conclued_that → I2_Belief → J4_that → I4_Proposition_Set
MASA
MOM
Lyon
2018
Formalisation of this mapping in TEI<div type="chapitre" xml:id="main_div">
<div type="section1" xml:id="sec1_1">
<div type="i4_proposition_set" xml:id="section1P0_1" subtype="evidence:observation">
<head>initial proposition title</head>
<figure>illustration</figure>
<p>comment
<ref>< !-- link to arsol data --></ref>
</p>
</div>
<div type="i4_proposition_set" xml:id="section1P1_1" subtype="proposition:function">
<head>intermediate proposition title</head>
<figure>illustration</figure>
<p>comment</p>
<div type="i5_inference_making">
<ptr subtype="j1_used_as_premise" target=” section1P0_1”>premise P0_1</ptr>
</div>
<div type="i5_inference_making">
<ptr subtype="j1_used_as_premise" target=” section1P0_2”>premise P0_2</ptr>
</div>
...
MASA
MOM
Lyon
2018
There’s a growing
flood of
publication.
Our assimilation
capacities remain
unchanged.
We CAN’T read all.
We just consult.
Web development
provide access to
new tools.
Jean-Claude Gardin
presents the logicist
programme.
Online logicist publications
are feasible.
A new way of publishing ?
Reasoning
in archaeology need
to be clarified.
MASA
MOM
Lyon
2018
Progression pour Rigny
• En ligne
• Données structurées
• Format libre
• standard W3C
• Interopérable
MASA
MOM
Lyon
2018
IHM MASA : OpenArchaeo
• Plateforme d’interrogation de jeux de données archéologique via le CIDOC-CRM
• Développement en cours par SPARNA (Thomas Francart)
• Choix des sources internes/externes
• Triplestore MASA
• Générateur de requêtes CIDOC-CRM SPARQL
• Modèle générique d’appariement jeux de données archéo/CIDOC-CRM
MASA
MOM
Lyon
2018
Application « Explorateur MASA »
Triplestore MASA (Virtuoso, GraphDB, autre)
Médiateur (endpoint SPARQL virtuel)
SPARQL endpoint
Adm
in
Source 1 Source n…
SPA
RQ
L
endp
oin
t
Adm
in
Triplestore
externe
SPARQL
Add
Update
Delete
data
Récupération des sources dans la query
Construction des requêtes à envoyer à chaque source
(Application d’une inférence CIDOC-CRM sur la query)
Envoi des requêtes à chaque source
Aggrégation résultats + interpréation ORDER BY / LIMIT / OFFSET
Spécification
sources
IHM SPARQL
« Simple Query
Generator »
{
config}
« Expansion sémantique de la query »{
config}
SPARQ
L simple
SPARQ
L étendu
SPARQL I/O
Affichage
Résultats
Traitements serveur Post traitement résultats SPARQL
Ajout des propriétés à afficher
Tablo
Carto
Tempo
Serveur (Java)
Client (javascript)
1
2
3
4
5
6
7
B
C
D
E
F
Fourniture référentiels
Ajout des sources
+ Choix des sourcesA
MASA
MOM
Lyon
2018
Modèle générique OpenArchaeo• Appliquer une
modélisation identique
aux jeux de données
archéologiques
• Sous-modèles type par
classes d’entités
MASA
MOM
Lyon
2018
Liste Initiale
Mobilier
U. S.
Site
Acteur
Fait
Mur
Sépulture
MASA
MOM
Lyon
2018
relié à …
U.S.…
U. S.
Sépulture
Site
Type
Temps
Recherche…
Mobilier
Fait
MASA
MOM
Lyon
2018
U. S.
U. S.
U. S.
U. S.
U. S.
U.S…Type
Interprétée comme
Contient
Trouvé à
Fait partie de
Site
Sépulture
Daté deTemps
Mobilier
U. S.Fait partie de
Fait
MASA
MOM
Lyon
2018
relié à …
Mobilier…
U. S.
Sépulture
Site
Mobilier
Concept
Temps
Recherche…
MASA
MOM
Lyon
2018
Mobilier…Mobilier Type
Utilisé pour
Fait en
MobilierTrouvé dans
U. S.
MobilierTrouvé dans
MobilierTrouvé dans
Site
Sépulture
MobilierDaté de
Temps
MASA
MOM
Lyon
2018
Conclusion• Besoin de sources de données archéologiques en ligne pour tester l'interopérabilité des
jeux de données appariés avec le CIDOC-CRM via OpenArchaeo.
• Tester l'interopérabilité à différentes échelles pour des bases de granularités différentes
(régionales, fouille).
• Formation des archéologues de MASA avec l'organisation d'une école thématique en
2019.
• Intégration dans ARIADNEplus