Top Banner
1 Ремарович С.С. Области применения онтологий – культурное наследие, биологические системы Институт программных систем НАН Украины 2012
50

Культурное наследие

Jan 19, 2016

Download

Documents

Salome Diaz

Ремарович С.С. Области применения онтологий – культурное наследие, биологические системы Институт программных систем НАН Украины 2012. Культурное наследие. Что такое культурное наследие? Разнообразие культурного наследия Функции информации о культурном наследии - PowerPoint PPT Presentation
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Page 1: Культурное  наследие

1

Ремарович С.С.

Области применения онтологий – культурное наследие, биологические

системы

Институт программных систем НАН Украины

2012

Page 2: Культурное  наследие

2

Культурное наследие

• Что такое культурное наследие?• Разнообразие культурного наследия• Функции информации о культурном наследии• Онтология CIDOC CRM - ISO21127• Терминология CRM• Список сущностей (фрагмент)• Пример описания сущностей• Рассуждение о пространственной информации• Рассуждения о темпоральной информации• Сущности верхнего уровня CIDOC CRM• Основные идеи CRM• FRBRoo и исполнительные виды искусства (Performing Arts)• Другие онтологии: ABC, DOLCE• Главные Терминологические Системы

Page 3: Культурное  наследие

3

Что такое культурное наследие?

В более узком смысле мы можем рассматривать культурное наследие как вещи, сохраненные учреждениями памяти, т.е. музеями, архивами и библиотеками.

В действительности культурное наследие - больше чем предметная область. Оно включает широкий спектр функций исследования и сохранения вещественных доказательств всех видов деятельности человека в прошлом.

Главные международные организации: Международный Совет Музеев (International Council of Museums - ICOM), Международная федерация библиотечных ассоциаций (International Federation of Library Associations - IFLA) и Международный Совет Архивов (International Council of Archives - ICA). Они поддерживают свои политики и стандарты специфической документации.

Обработка информации обо всех видах вещей подразумевает использование очень богатой терминологии, многоязычная и часто специфическая для особых сообществ или даже определенных ученых. Соглашение по общей терминологии является трудным и эквивалентные термины на других языках часто отсутствуют.

Page 4: Культурное  наследие

4

Разнообразие культурного наследия Главные виды коллекций: • история искусств и современные искусства (графика, живопись,

фотография, скульптура, архитектура, рукописи, религиозные объекты);

• историческое наследие (соглашения, письма, рукописи, рисунки, фотографии, фильмы, личные объекты, оружие);

• археология (черепки, скульптуры, инструменты, оружие, домашние изделия, человеческие остатки);

• дизайн (мебель, столовая посуда, автомобили, и т.д.);• наука и техника (машины, инструменты, оружие, транспортные

средства, известные эксперименты, открытия);• этнология (костюмы, инструменты, оружие, домашние изделия,

религиозные объекты, и т.д.);• неподвижные места (Immobile sites) (архитектура, скульптура,

горное искусство, пещеры);• коллекции естествознания, такие как палеонтология, био-

разнообразие, минералогия - также доказательства деятельности человека (т.е. исследование) и следовательно культура.

Page 5: Культурное  наследие

5

Функции информации о культурном наследии

Виды информационных систем культурного наследия по их главным функциям:

• управление коллекцией (приобретение, регистрация, пополнение (“deaccession”), инвентарь, ссуды, выставки, страховка, права, зоны защиты);

• сохранение (диагностика состояния, превентивные меры, вмешательства, обработки и химические вещества);

• научное исследование (исследование, описание, интерпретация);

• представление (порталы, обучение, публикация).Информация во всех этих системах частично совпадает и

должна быть взаимно доступной. Одна из основных проблем управления информацией о культурном наследии - способность к взаимодействию этих систем и интеграция информации.

Page 6: Культурное  наследие

6

Проблема интеграции схемы Большинство профессиональных информационных систем основано

на довольно сложных схемах баз данных. Например, CIDOC, предложенная в 1995 г., стандартная реляционная схема для музеев, содержит более чем 400 таблиц. Информация о культурном наследии распределена во многих разных системах, которые дополняют друг друга. Например, один источник может связать римские имена с римскими надписями, другой - римские надписи с камнями, следующий - камни с местом обнаружения и другой - места с координатами.

Онтология CIDOC CRM (Conceptual Reference Model )(теперь ISO21127, с 2006 г.) в настоящее время является наиболее разработанной онтологией для интеграции информации о культурном наследии.

CIDOC CRM - формальная онтология, которая предназначена, чтобы облегчить интеграцию, посредничество и обмен гетерогенной информацией о культурном наследии. Была разработана междисциплинарными командами экспертов, которые представляют такие области как информатика, археология, музейная документация, история искусств, естествознание, библиотечная наука, физика и философия, под эгидой Международного комитета Документации (CIDOC) Международного Совета Музеев (ICOM).

Page 7: Культурное  наследие

7

ISO21127CIDOC CRM онтология представлена в текстовой форме,

чтобы продемонстрировать независимость от форматов представления знаний. Существует формальное определение в TELOS.

CRM отличает отдельные классы от свойств (бинарные отношения). Свойства являются направленными и двунаправленными с определенными метками для каждого направления.

Использует строгое многократное наследование (без исключений) для классов и свойств, предусматривает многократное создание экземпляра (instantiation), т.е. один определенный элемент может быть экземпляром больше чем одного класса.

Существуют эквиваленты в KIF, RDFS и OWL. Содержит 80 классов и 132 свойства.

Page 8: Культурное  наследие

8

Терминология CRM

• "Entity" для чего-либо, что можно назвать "классом", "сущностью" или "узлом“(“class”, “entity” or “node” ).

• "Links" для чего-либо, что можно назвать "атрибутом", "ссылкой", "связью" или "свойством“(“attribute”, “reference”, “link”, or “property” ).

• “ Superclass - Subclass” отношения относятся к “isA” отношениям, “подкласс – суперкласс”, “родительский класс - производный класс”, “обобщение - специализация”, и т.д (“subclass – superclass”, “ parent class - derived class”, “generalization - specialization”).

По умолчанию все ссылки (links) (или свойства) рассматриваются как необязательные(optional), и потенциально многократные(multiple). Ссылки строго наследуются подклассами. У ссылок могут самостоятельно быть ссылки, которые указывают на другие сущности.

Page 9: Культурное  наследие

9

Список сущностей (фрагмент)

E1 CRM EntityE2 - Temporal EntityE3 - - Condition StateE4 - - PeriodE5 - - - EventE7 - - - - ActivityE8 - - - - - AcquisitionE9 - - - - - MoveE10 - - - - - Transfer of CustodyE11 - - - - - ModificationE12 - - - - - - ProductionE13 - - - - - Attribute AssignmentE14 - - - - - - Condition AssessmentE15 - - - - - - Identifier AssignmentE16 - - - - - - MeasurementE17 - - - - - - Type AssignmentE65 - - - - - Conceptual CreationE66 - - - - - FormationE63 - - - - Beginning of ExistenceE67 - - - - - BirthE12 - - - - - Production E65 - - - - - Conceptual CreationE66 - - - - - FormationE64 - - - - End of ExistenceE6 - - - - - Destruction E68 - - - - - DissolutionE69 - - - - - Death

E72 - Stuff

E18 - - Physical Stuff

E19 - - - Physical Object

E20 - - - - Biological Object

E21 - - - - - Person

E22 - - - - Man-Made Object

E23 - - - - - Iconographic Object

E24 - - - Physical Man-Made Stuff

E22 - - - - Man-Made Object

E23 - - - - Iconographic Object

E25 - - - - Man-Made Feature

E26 - - - Physical Feature

E27 - - - - Site

E21 - - - - Person

E25 - - - - Man-Made Feature

E71 - - Man-Made Stuff

E24 - - - Physical Man-Made Stuff

E22 - - - - Man-Made Object

E23 - - - - - Iconographic Object

E25 - - - - Man-Made Feature

E28 - - - Conceptual Object

E73 - - - - Information Object

E23 - - - - - Iconographic Object

Page 10: Культурное  наследие

10

Пример описания сущностейE1 CRM EntityBelongs to: Meta EntitySuperclass of:Temporal Entity

Actor Appellation Contact Point Time-Span Place Dimension Type Number Stuff Legal Object

Scope note: This is the abstract concept of the entities of our universe of discourse. It carries the rule that all entities can be classified by a type, which further refines the specific subclass an instance belongs to, and a free text field for anything we want to express and that is not captured by formal links.

Properties:identification is identified by (identifies): Appellationclassifications has type (is type of): Typeother descriptions has note: String

(has type : Type)The entity is referenced by:Type Assignment: classified (was classified by)Document: documents (is documented in) Conceptual Object: refers to (is referred to by)(has type : Type)End of Existence: took out of existence (was taken out of existence by)Beginning of Existence: brought into existence (was brought into existence by)

Page 11: Культурное  наследие

11

E4 PeriodBelongs to: Period TypeSubclass of: Temporal EntitySuperclass of: Event Scope note: A period is characterized by a coherent set of phenomena and or manifestations (explicitly intended or

not), which are assumed to have taken place over a certain space and time.Examples: Glacial period, bronze period, Ming Dynasty, Impressionism, Neolithic Period, Mc Carthy Era, The Sixties,

Niniveh, 'Sturm und Drang'.Properties:identifications is identified by (identifies): Appellationclassifications has type (is type of): Typespatial definitions took place at (witnessed): Placespatial definitions, short cut took place on or within (witnessed): Physical Objecttemporal definitions has time-span (is time-span of): Time-Spanstructures consists of (forms part of): Period falls within (contains): Periodother descriptions has note: String (has type : Type)The entity is referenced only by itself.The entity inherits references:Type Assignment: classified (was classified by)Document: documents (is documented in)Conceptual Object: refers to (is referred to by) (has type : Type)Beginning of Existence: brought into existence (was brought into existence by)End of Existence: took out of existence (was taken out of existence by)

Page 12: Культурное  наследие

12

Рассуждение о пространственной информации

0,n

0,n

0,n0,n

0,n

0,n

0,n

0,n

0,n 0,n

Actor Place

Physical ObjectAddress Spatial Coordinates

Contact Point

has contact points (provides access to)

Appellationconsists of (forms part of)

Place Name

Place Appellation

identifies (is identified by)

Section Definitiondefines section (has section definition)

has section (is located on or within)

CIDOC Entity

Physical Entity

Page 13: Культурное  наследие

13

Рассуждения о темпоральной информации

0,n

0,n

0,n 0,n

0,n 0,n

0,n 0,n 0,n

0,n

0,n 0,n

0,n

0,n

0,n

0,n

Temporal Entity

Event

Period Appellation

Place

is called (identifies)

took place at (witnessed)

Condition State Period

Time Span

has time-span (is time-span of)

consists of (forms part of)

falls within (contains)

CRM Entity

consists of (forms part of) falls within (contains)

Date

Appellation

Time Appellation

is identified by (identifies)

Page 14: Культурное  наследие

14

Сущности верхнего уровня CIDOC CRM

Page 15: Культурное  наследие

15

Папа Римский Leo І встречает Attila

Page 16: Культурное  наследие

16

Основные идеи CRM1. Возможная двусмысленность отношений между сущностями и

идентификаторами («Appellations» – "Названия"), которые используются, чтобы обратиться к сущностям, которые являются частью исторической действительности, которые будут описаны онтологией. Поэтому, CRM отличает узлы, представляющие реальные элементы, от узлов, представляющих только названия элемента.

2. "Type" и системы классификации являются не только средством, чтобы структурировать информацию о действительности с внешней точки зрения, но также и частью исторической действительности как человеческие изобретения. Как таковые, они подпадают под “Conceptual Objects”, наследуя свойства создания, использования и т.д. Точно так же вся документация видится как часть действительности, и может быть описана непосредственно вместе с описанным содержанием. С этой проблемой материализации не имеют дело текущие языки онтологии. CRM вынужден использовать некоторые искусственные приемы, которые мы не анализируем здесь.

Page 17: Культурное  наследие

17

Основные идеи CRM (продолжение)3. Нормальный человеческий способ проанализировать прошлое

состоит в том, чтобы разделить развитие сущностей на дискретные события в пространстве и времени. Таким образом, описанное прошлое может быть сформулировано как серия событий, вовлекающих “Persistent Items” (постоянные элементы) (названные endurants) подобно Physical Things и Persons. Соединение элементов, мест и времени через события создает понятие " world-lines (мировых линий)" вещей, встречающихся в пространстве и времени (см. рис.). События, замеченные как процессы произвольного масштаба, обобщены как “Periods" и далее как “Temporal Entities” (названные perdurants). Последние два класса непосредственно связаны с пространством и временем в онтологии.

Page 18: Культурное  наследие

18

Основные идеи CRM (продолжение)4. Невещественные объекты (“Conceptual Objects”) являются

элементами, которые могут быть созданы, но могут находиться больше чем на одном физическом носителе в то же самое время, включая человеческие мозги. Невещественные элементы могут присутствовать в событиях через соответствующие физические информационные носители (см. рис.). Невещественные элементы не могут быть разрушены, но они исчезают, когда последний носитель потерян.

Page 19: Культурное  наследие

19

FRBRoo и исполнительные виды искусства (Performing Arts)

Модель FRBR (Functional Requirements for Bibliographic Records - Функциональные Требования для Библиографических записей) была разработана как модель сущность-отношение исследовательской группой, назначенной Международной федерацией Библиотечных ассоциаций и Учреждений (International Federation of Library Associations and Institutions - IFLA) в 1991–1997г.г. В 1998 она была издана.

Отличает четыре уровня абстракции - от понятия до книги в моих руках: Работа, Выражение, Проявление, Пункт (Work, Expression, Manifestation, Item).

Формирование в 2003 г. Международной Рабочей группы по гармонизации FRBR/CIDOC CRM.

Цель - выразить модель IFLA FRBR понятиями, онтологической методологией и соглашениями нотации, обеспеченными CIDOC CRM, и слить две объектно-ориентированные модели.

Page 20: Культурное  наследие

20

FRBRoo (продолжение)

2008 г. - заключительный проект FRBRoo, то есть объектно-ориентированная версия FRBR, согласованная с CIDOC CRM. Эта формальная онтология предназначена, чтобы охватить и представить основную семантику библиографической информации и облегчить интеграцию, посредничество и обмен библиографической и музейной информацией.

Главное новшество FRBRoo - реалистическая, явная модель интеллектуального процесса создания, которая должна быть развита далее в будущем в пользу библиотекарей и ученых из различных музейных дисциплин. FRBRoo делает фундаментальное различие между внутренними представлениями нашего ума (Work), наборами знаков или символов, которые человек может интерпретировать (Expression), и физическими информационными носителями.

Текущая версия FRBRoo включает модель исполнительных видов искусства (performing arts), соединяя интерпретацию театральных игр с записью и документацией действий. Отличает и связывает три интеллектуальных вклада (работы) создания игры, интерпретации и записи со связанными символическими формами и физическими носителями.

Page 21: Культурное  наследие

21

Другие онтологии

Онтология ABC - результат Проекта Гармонии, который финансировался совместно Технологическим Кооперативным Научно-исследовательским центром Распределенных Систем (Distributed Systems Technology Cooperative Research Centre - DSTC) (Австралия), Объединенным Комитетом по Информационным системам (Joint Information Systems Committee - JISC) (Великобритания) и Инициативой Национального научного фонда Цифровых Библиотек (National Science Foundation Digital Libraries Initiative - NSF DLI2) (США).

Цель - потребность объединить информацию от множества жанров мультимедийной информации в пределах цифровых библиотек. Содержит13 классов и 14 свойств. Как CIDOC CRM, ABC описывает темпоральность.

ABC включает оба понятия "events" и " situations", которые соответственно моделируют переходы (transitions) (т.е. глаголы) и экзистенциальные свойства. ABC основывается на понятиях, развитых в модели FRBR. Эти понятия – работы, выражения, проявления и пункты – дают ABC возможность связать сущности, у которых есть общее происхождение интеллектуальной собственности.

Page 22: Культурное  наследие

22

Графическое представление Модели ABC (пример) Рассказ в качестве примера: 14 июня 2001 в Wesley Hospital, была доставлена девочка 8

фунтов 11 унций к родителям Jill и John Smith. Акушеркой при доставке была Jane Kildare и акушером был Carl Nightingate.

Этот пример демонстрирует, как Action type детализирует, или более узко определяет действия, которые происходят в Event. Agent Role далее детализирует или более узко определяет роль определенных агентов в действии.

Page 23: Культурное  наследие

23

Другие онтологии (продолжение)

Онтология DOLCE (Descriptive Ontology for Linguistic and Cognitive Engineering) - продукт переработки основных концептов WordNet, лингвистический ресурс, полученный из словарей, обогащенных на основе теории основополагающих отношений, таких как участие, часть-целое, состав и т.д. Строго сформулировано в логике, делая ее довольно трудной для экспертов области, чтобы постигать и использовать ее. В отличие от CRM, пространство и время рассматриваются как зависимые свойства вещей, а не как вещи, существующие в потенциально пустом пространстве-времени – единственная, но глубокая несовместимость между обеими онтологиями.

Page 24: Культурное  наследие

24

Характеристики онтологий для культурного наследия

Культурное наследие может быть рассмотрено как материальное доказательство деятельности человека в прошлом. Поэтому:

• информация является мезоскопической, т.е. в человеческом масштабе, ни астрономической, ни микроскопической, за исключением микроскопического анализа следов и материалов. Информация дискретна. О процессах сообщают или становятся очевидными как дискретные события, вовлекающие дискретные вещи, в отличие от геологического или метеорологического явления;

• информация является центральным событием. Вещи, люди и идеи соединяются и имеют отношение через события;

• описание является ретроспективным, в отличие от информации, чтобы планировать будущее.

Page 25: Культурное  наследие

25

Терминология в культурном наследии

Терминология для библиотекарей - обеспечение доступа к информации.

Терминология культурного наследия - поддержка построения гипотезы. Поэтому терминология культурного наследия могла быть разделена на верхний, устойчивый уровень, подходящий для поиска, и более низкий изменчивый уровень, который поддерживает построение гипотезы.

Проблема с классификацией материальных объектов - различные аспекты (aspects) (facets), под которыми может быть сделана классификация. Доминирующие аспекты - функция объекта, его формы или появления, элементы или принципы конструкции. Эти три аспекта частично связаны. Например, у типичного молотка могут быть классическая форма и конструкция, но моторизованный молоток может только разделить функцию, но не другие аспекты. Другие аспекты - формы, определенные для исторических периодов или стран. Результат может сбить с толку редакторов тезауруса и онтологии, при построении иерархии IsA, и может ввести в заблуждение пользователей, когда они применяют термины классификации.

Page 26: Культурное  наследие

26

Главные Терминологические Системы AAT (Art & Architecture Thesaurus )- самая широко распространенная онтология в

культурном наследии. Ее тема - искусство и архитектура, но покрывает широкий диапазон археологических и этнологических материалов, а также любые виды объекта, которые могут быть предметом искусства. Построена для фасетной классификации. Ее главные фасеты: Действия (Activities), Агенты (Agents), Материалы (Materials), Объекты (Objects), Физические атрибуты (Physical Attributes), Стили & Периоды (Styles & Periods), Связанные Концепты (Associated Concepts). Используются отношение IsA. Ее первоначально моноиерархическая (“tree") обобщенная структура была расширена до полииерархической (направленый нециклический граф).

English Heritage ( EH) поддерживает большие тезаурусы терминов для мобильных и неподвижных объектов для Соединенного Королевства, а также французский тезаурус MERIMEE.

SHIC - система классификации деятельности человека, для описания музейных экспонатов несколькими британскими музеями. Вместо того, чтобы характеризовать объект, рассматривается только функция или полезность объекта для деятельности человека.

ICONCLASS - единственная широко распространенная система для иконографической классификации.

CAMEO - доступный для поиска информационный центр, созданый Музеем изобразительных искусств, Бостон.

База данных MATERIALS содержит химическую, физическую, визуальную и аналитическую информацию о более чем 10 000 исторических и современных материалах, используемых в производстве и сохранении артистических, архитектурных, археологических и антропологических материалов. Она предлагает только поиск по ключевым словам и алфавитный порядок.

Page 27: Культурное  наследие

27

Источники (культурное наследие)

1. Martin Doerr, “Ontologies for Cultural Heritage” (Steffen Staab, Rudi Studer, “Handbook on Ontologies”, Second Edition, Springer)

2. M. Doerr, “The CIDOC CRM - An Ontological Approach to Semantic Interoperabilityof Metadata”, AI Magazine, 24(3), 2003

3. Carl Lagoze, Jane Hunter, "The ABC Ontology and Model", DC-2001, International Conference on Dublin Core and Metadata, Tokyo, October 2001, http://metadata.net/harmony/lagoze_hunter_dc2001.pdf

4. http://www.cidoc-crm.org/technical_papers.html

Page 28: Культурное  наследие

28

Онтологии для формального представления биологических систем

• Онтологические артефакты• Цели использования онтологий в биомедицинском исследовании• Построение гипотез и моделей биологических систем• Задачи разработки формального представления• Роль Семантической паутины• Примеры онтологий• Foundational Model of Anatomy - FMA• Основополагающие принципы дисциплинированного

моделирования• Схема основных классов АТ(Anatomy Taxonomy)• Примеры определений классов• Схема Анатомической Структурной Абстракции (ASA)

• Схема Абстракции Анатомического Преобразования (ATA)• Среда моделирования знаний - Protégé-2000• Архитектура Anatomy Information System - AIS

Page 29: Культурное  наследие

29

Онтологические артефакты:

- управляемые словари (controlled vocabularies - CV). CV обеспечивает список терминов, которые используются обычно, чтобы индексировать записи в базе данных. Генная онтология (Gene Ontology - GO) наиболее широко использует CV.

- информационная модель (модель данных) описывает, как различные части информации связаны друг с другом. Microarray Gene Expression Object Model (MAGE-OM) является примером информационной модели.

- онтология - спецификация сущностей (или понятий) и отношений между ними в области обсуждения; наряду с декларациями свойств каждого отношения и набором явных аксиом, определенных для этих отношений и сущностей. Примером является Foundational Model of Anatomy (FMA) - основополагающая модель анатомии, которая представляет классы и отношения, необходимые для символического моделирования структуры человеческого тела, в форме, которая является понятной людям и является также управляемой, синтаксически анализируемой и поддающаяся толкованию машинными системами.

Page 30: Культурное  наследие

30

Использование онтологий в биомедицинском исследовании

- интегрировать разнообразную информацию о биологических системах, чтобы сформулировать гипотезы

- создать базы знаний, чтобы получить соответствующие факты, организовать и интерпретировать несопоставимые знания, вывести неочевидные отношения и оценить гипотезы, выдвигаемые учеными

- использование онтологий для формального представления биологических систем

Page 31: Культурное  наследие

31

Построение гипотез и моделей биологических систем

Задачи процесса биомедицинского исследования : • сбор информации различных типов о биологических

объектах, которые участвуют в биологическом процессе;

• формулирование гипотезы (или модели) об отношениях среди этих объектов;

• исследование различных данных, чтобы оценить степень, до которой поддерживается гипотеза;

• совершенствование гипотезы, чтобы достигнуть самого лучшего соответствия с данными.

Page 32: Культурное  наследие

32

Построение гипотез и моделей биологических систем (продолжение)

Требуемые свойства формального представления для моделей биологических процессов:

1). Возможность представить структуру, функции и динамику биологического процесса.

2). Формальное представление должно включать объединенную онтологию, которая однозначно идентифицирует объекты и отношения в процессе.

3). Возможность представить биологические процессы в различных масштабах и позволить иерархическое представление подпроцессов, чтобы управлять сложностью.

4). Возможность включать новые данные и новые категории информации.

5). Концептуальная (математическая) платформа должна позволять проверку системных свойств, используя моделирование и/или логические механизмы вывода.

6). Представление должно иметь интуитивную визуальную схему.

Page 33: Культурное  наследие

33

Задачи разработки формального представления

Представление знаний. Представление различных видов биологических объектов, участвующих в любом процессе болезни, и многих качественно различных видов отношений между ними. Необходимы различные онтологии, чтобы представлять биологические процессы на разных уровнях детализации, поскольку биологические процессы и соответствующие данные можно рассматривать на переменных уровнях детализации, в пределах от молекулярных механизмов до общих процессов, таких как деление клетки, и от матриц исходных данных до качественных отношений.

Концептуальное представление. Концептуальная структура биологической системы позволяет рассуждать о биологической системе и выполнять мысленные эксперименты. Концептуальная основа для представления биологических систем должна вмещать модульный принцип и темпоральное поведение биологических систем. Концептуальные основы, используемые, чтобы представить биологические модели, изменяются от уравнений полного дифференциала до булевских выражений, от сетей Байеса, сетей Петри до исчисления процессов, специальных логик и систем правил.

Знания и сбор данных. Сбор, хранение и кодирование существующей информации. Информация находится в отдельных репозитариях, с пользовательскими форматами хранения и разнообразными методами доступа.

Page 34: Культурное  наследие

34

Роль Семантической паутины

Ожидание от Семантической паутины в науках о жизни состоит в том, что отношения, которые существуют неявно в умах ученых, будут явно объявлены (используя онтологии OWL) и затем использоваться, чтобы агрегировать геномные, белковые, клеточные, физиологические и химические данные. Семантические определения зададут, какие объекты связаны с другими и как. Такое связывание позволит семантическим инструментам вытащить вместе разнообразную информацию, представить ее способом, определенным пользователем, и возможно рассуждать над сопоставленной информацией, чтобы получить новое понимание.

Page 35: Культурное  наследие

35

• Gene Ontology - http://www.geneontology.orgГлавная инициатива биоинформатики с целью стандартизации

представления гена и атрибутов генных продуктов по разновидностям и базам данных. Проект обеспечивает управляемый словарь терминов для того, чтобы описать характеристики генного продукта и данные аннотации генного продукта от участников GO Consortium , а также инструменты, чтобы получить доступ и обработать эти данные.

• Foundational Model of Anatomy (FMA) - http://fma.biostr.washington.edu

Является доменной онтологией концептов и отношений, которые принадлежат структурной организации человеческого тела. FMA как ссылочная онтология в биомедицинской информатике, чтобы коррелировать другие представления анатомии, выравнивая существующие и появляющиеся онтологии в онтологиях биоинформатики и обеспечивая структурный шаблон для представления биологических функций.

Примеры онтологий

Page 36: Культурное  наследие

36

Foundational Model of Anatomy - FMA Модель содержит 70 000 различных

анатомических понятий — представление структур от некоторых макромолекулярных комплексов и компонентов клетки к главным частям тела. Эти понятия связаны более чем с 110 000 термов и связаны друг с другом более чем 1.5 миллионами экземпляров из более чем 170 видов отношений.

Подход к моделированию - дисциплинированное моделирование (disciplined modeling).

Page 37: Культурное  наследие

37

Основополагающие принципы дисциплинированного моделирования

• Объединенный контекстный принцип. Абстракция должна соответствовать строго структурному контексту.

• Принцип абстрактного уровня. Абстракция должна моделировать каноническую анатомию и служить основой для анатомических вариантов, но должна исключить инстанцированную анатомию (instantiated anatomy).

• Принцип специфики разновидностей. Начальная итерация абстракции должна смоделировать анатомию Homo sapiens, но одновременно она должна служить платформой для анатомии других млекопитающих и, в конечном счете, других видов позвоночных.

• Принцип определения. Определение атрибутов класса в модели должно быть определено в терминах физических и других структурных (т.е., анатомических) атрибутов анатомических сущностей, которые включает класс.

• Принцип доминирующего концепта. Доминирующий класс онтологии– это класс, в отношении которого в онтологии определены другие классы.

Page 38: Культурное  наследие

38

Основополагающие принципы дисциплинированного моделирования

(продолжение)• Принцип организационного элемента (Organizational unit principle).

Абстракция должна иметь два элемента, с точки зрения которых определены подклассы Анатомической структуры (Anatomical structure): Клетка (Cell) и Орган (Organ).

• Принцип ограничения контента. Самая большая представленная анатомическая структура должна быть целым организмом (в текущей итерации, человеческое тело) и самое маленькое Биологическая макромолекула. Если возникает потребность, молекулы, не синтезируемые через выражение собственных генов организма, должны быть представлены в отдельных онтологиях.

• Принцип ограничения отношения. Абстракция должна моделировать три типа отношений, которые появляются между анатомическими сущностями: 1) отношения категоризации класса; 2) статические физические отношения; 3) отношения, которые описывают преобразование анатомических сущностей во время онтогенеза (индивидуальное развитие) организма.

• Принцип когерентности. У абстракции должен быть один корень, Anatomical entity, который включает все объекты (entity), которые касаются структурной организации тела; понятия, относящиеся к этим объектам, должны быть расположены в единственной и всеобъемлющей иерархии категоризации класса наследования.

• Принцип представления. Абстракция должна быть смоделирована как онтология анатомических концептов и должна разместить все поименованные соглашения, связанные с этими концептами.

Page 39: Культурное  наследие

39

Высокоуровневая схема FMA = (АТ, ASA, ATA, Mk), где АТ - Таксономия Анатомии (Anatomy Taxonomy);ASA - Анатомическая Структурная Абстракция (Anatomical

Structural Abstraction) описывает разделительные (meronymic) (partitive (meronymic)) и пространственные отношения понятий, представленных в таксономии;

ATA - Абстракция Анатомического Преобразования (Anatomical Transformation Abstraction) описывает морфологические преобразования с временной зависимостью понятий, представленных в таксономии во время жизненного цикла человека, который включает пренатальное развитие, послеродовой рост и старение;

Mk - Метазнания (Metaknowledge), которые включают принципы и наборы правил, согласно которым представляются отношения в других трех компонентных абстракциях модели.

Page 40: Культурное  наследие

40

Схема основных классов АТAnatomical

Entity

Physical Anatomical Entity

Non-physicalAnatomical Entity

Material Physical Anatomical Entity

Non-material Physical Anatomical Entity

Anatomical Relationship

- is a -

Anatomical spaceBody Substance(вещество)

Anatomical Structure

BiologicalMacromolecule

Cell Organ

CellPart

Tissue(ткань)

Organ Part

Organ System

Body Part

Human Body

Page 41: Культурное  наследие

41

Примеры определений классов

Anatomical entity is a biological entity,which constitutes the structural organization of a

biological organism, or is an attribute of that organization.Anatomical structure is a material physical anatomical entity

which has inherent 3D shape;is generated by coordinated expression of the organism’s own structural genes;consists of parts that are anatomical structures;

spatially related to one another in patternsdetermined by coordinated gene expression.

Cell is a anatomical structurewhich consists of cytoplasm surrounded by a plasma membrane

with or without the cell nucleus.

Page 42: Культурное  наследие

42

Примеры определений классов (продолжение)_

Organ is an anatomical structure,

which consists of the maximal set of organ parts

so connected to one another that together

they constitute a self-contained unit of macroscopic anatomy

morphologically distinct from other such units.

Organ part is an anatomical structure,

which consists of two or more types of tissues,

spatially related to one another in patterns determined by coordinated gene expression;

together with other contiguous organ parts it constitutes an organ.

Tissue is an anatomical structure,

which consists of similarly specialized cells and intercellular matrix, aggregated according to genetically determined spatial relationships.

Page 43: Культурное  наследие

43

Часть таксономии структурных отношений

Page 44: Культурное  наследие

44

Схема Анатомической Структурной Абстракции (ASA)ASA

Anatomical Structural Abstraction

DTDimensional

Taxonomy

BnBoundarynetwork

PnPart-of

network

SAnSpatial

Associationnetwork

CnConnectivity

network

OnOrientation

network

LnLocationnetwork

CTMnContainment

network

AJnAdjacencynetwork

QCnQualitative coordinate

network

CTnContinuity

network

ATnAttachment

network

SYnSynaptic

Connectivitynetwork

Page 45: Культурное  наследие

45

Схема Абстракции Анатомического Преобразования (ATA)

ATAAnatomical Transformation Abstraction

DevTDevelopmental

Taxonomy

DLDevelopmental

Lieneage

PTrPhenotypic

Transformation

RnRegulatory Networks

DPTDevelopmental Time Parameter

A1

Immediate Precursor

D1

Immediate Descendant

∆PtPhenotype

Change

PC1

Immediate Precursor

S1

Immediate Descendant

∆PtPhenotype

Change

DStrTDevelopmental

Structure Taxonomy

DSpTDevelopmental

Space Taxonomy

DPTDevelopmental

Process Taxonomy

POTPost-ovulatory

Time

DStDevelopmental

Stage

TAgTransformating

Agent

ScSource of TAg

TgTarget of TAg

Gf

Gene facilitated

Gr

Gene repressed

PropPropagation of

TAg

∆PtPhenotype

Change

Page 46: Культурное  наследие

46

Среда моделирования знаний - Protégé-2000

Фрейм концепта Vertebra

Page 47: Культурное  наследие

47

Среда моделирования знаний - Protégé-2000

Разнообразие терминов, связанных с понятием Uterine tube

Page 48: Культурное  наследие

48

Среда моделирования знаний - Protégé-2000

Отношения приписанной смежности и преемственности для понятия Esophagus (пищевод)

Page 49: Культурное  наследие

49

Архитектура Anatomy Information System - AIS Protege

GAPP

Image Manager

FMEEmily

GOQAFMA

FMA

FMA Server

3D Model Server

Image Server

Other agents and interfaces

Other agents and interfaces

Image Database

Annotated Image

Model Database

3D Models

Page 50: Культурное  наследие

50

Источники (биосистемы)

1. Nigam Shah, Mark Musen, “Ontologies for Formal Representation of Biological Systems” (Steffen Staab, Rudi Studer, “Handbook on Ontologies”, Second Edition, Springer)

2. C. Rosse, J. L. V. Mejino, “A reference ontology for biomedical informatics:the foundational model of anatomy”, J Biomed Inform, 36(6):478–500, Dec 2003.

3. http://fma.biostr.washington.edu