RDF БАЗИ ОТ ДАННИ Доц. д-р Цветанка Георгиева-Трифонова
Aug 02, 2015
RDF БАЗИ ОТ ДАННИ – СЪДЪРЖАНИЕ
Характеристики на RDF (Resource Description
Framework) базите от данни
Предимства на RDF бази от данни
Сравняване на RDF с XML и релационни бази от
данни
2 2 Цветанка Георгиева Моделиране на информационни системи
ХАРАКТЕРИСТИКИ НА RDF БАЗИТЕ ОТ ДАННИ
RDF системите за бази от данни
са стандартизирани NoSQL решения, които се основават
на:
прост, единен модел на данни;
мощен, декларативен език за заявки.
предлагат преносимост на данните и съвместимост между
конкурентни приложения.
3 3 Цветанка Георгиева Моделиране на информационни системи
ХАРАКТЕРИСТИКИ НА RDF БАЗИТЕ ОТ ДАННИ
RDF системите за бази от данни формират подмножество на
графовите бази от данни – една от категориите NoSQL бази
от данни.
Примери за RDF бази от данни са:
AllegroGraph, Virtuoso, Stardog, др.;
както и такива с отворен код: ARC, 4store, др.
RDF данните могат да бъдат разглеждани като насочен граф,
където дъгите:
започват с URI на субектите;
имат етикети с URI на предикатите;
завършват, като сочат URI на обектите или скаларни
стойности.
4 4 Цветанка Георгиева Моделиране на информационни системи
ХАРАКТЕРИСТИКИ НА RDF БАЗИТЕ ОТ ДАННИ
Пример
5 5 Цветанка Георгиева Моделиране на информационни системи
ОСНОВНИ ПРЕДИМСТВА НА RDF БАЗИ ОТ ДАННИ
Прост и единен стандартен модел на данните
NoSQL базите от данни имат специфични модели на
данните и възможности, предназначени специално за
всяка реализация;
Като правило, тези модели на данните не са нито
съвместими, нито стандартизирани и обикновено са
описани в документацията на съответната версия на
конкретния програмен продукт;
В сравнение с тях системите за RDF бази от данни
използват един добре дефиниран и W3C-стандартизиран
модел на данните.
6 6 Цветанка Георгиева Моделиране на информационни системи
ОСНОВНИ ПРЕДИМСТВА НА RDF БАЗИ ОТ ДАННИ
Стандартизирани формати за обмен на информация
Някои NoSQL бази от данни имат възможност за
импорт/експорт от/към структури, специфични за
реализацията, представени в XML или JSON формат.
От друга страна всички RDF бази от данни имат
възможност за импорт/експорт въз основа на добре
дефинирани, стандартизирани формати за сериализиране
като RDF/XML, N-Triples, N-Quads, др.
7 7 Цветанка Георгиева Моделиране на информационни системи
ОСНОВНИ ПРЕДИМСТВА НА RDF БАЗИ ОТ ДАННИ
Мощен стандартен език за заявки
NoSQL базите от данни обикновено не предоставят
декларативен език за заявки от високо ниво, подобен на
SQL;
Изпълняването на заявки при тези бази от данни се
програмира според конкретния модел на данните, според
конкретния език и дори според конкретно приложение;
Ако е налице език за заявки, той е напълно специфичен
за реализацията (например SimpleDB или GQL);
SPARQL е голямо предимство за RDF базите от данни, тъй
като представлява стандартен език за заявки, който има
възможности, сравними с тези на SQL и е дефиниран при
запазване на голяма част от познатия синтаксис.
8 8 Цветанка Георгиева Моделиране на информационни системи
ДОПЪЛНИТЕЛНИ ПРЕДИМСТВА НА RDF БАЗИ ОТ
ДАННИ
Преносимост на данните
При използване на различни конкуриращи се системи за
бази от данни, за да се:
включат множество различни решения едновременно;
обменят данни с външни организации,
данните могат да бъдат предавани, без да се налага да се
пише и използва допълнителен потребителски код за
преобразуване на някои формати и структури от данни в
други несъвместими формати и структури от данни.
9 9 Цветанка Георгиева Моделиране на информационни системи
ДОПЪЛНИТЕЛНИ ПРЕДИМСТВА НА RDF БАЗИ ОТ
ДАННИ
Съвместимост (Toolchain interoperability)
Библиотеките и инструментите (toolchains) за RDF
обикновено не са или са слабо свързани с конкретната
реализация на СУБД;
По принцип не е от значение с коя специално RDF-
базирана система се осъществява връзката, ако
например се използва и програмира с Jena или Sesame
за Java и Scala, RDFLib за Python, ARC за PHP или RDF.rb
за Ruby;
Подобно на релационните бази от данни, RDF-базираният
код не трябва да се променя, само защото е нужно да се
направи еквивалент на преминаване от MySQL към
PostgreSQL.
10 10 Цветанка Георгиева Моделиране на информационни системи
ДОПЪЛНИТЕЛНИ ПРЕДИМСТВА НА RDF БАЗИ ОТ
ДАННИ
Липсва зависимост от доставчика (No vendor lock-in)
Ако дадено приложение използва RDF базата от данни X,
но по някаква причина възникнат проблеми, то може да
се извърши преминаване към RDF база от данни Y или Z
или някоя друга от наличните съвместими решения;
Тази задача не толкова тежка, в сравнение с
превключване между две не-RDF решения.
11 11 Цветанка Георгиева Моделиране на информационни системи
ДОПЪЛНИТЕЛНИ ПРЕДИМСТВА НА RDF БАЗИ ОТ
ДАННИ
Гарантирано бъдеще
RDF е дефиниран стандарт за публикуване на свързани
данни (linked data) в интернет и е изцяло построен въз
основа на утвърдени стандарти като URI адреси;
Напълно основателно може да се предположи, че RDF
данните ще бъдат използваеми в бъдеще;
Не може да се твърди същото за някои от другите NoSQL
решения, много от които неизбежно ще се окажат по-
скоро краткотрайни.
12 12 Цветанка Георгиева Моделиране на информационни системи
СРАВНЯВАНЕ НА RDF С XML
XML се използва за представяне на модел на
полуструктурираните данни
Йерархична структура с вложени елементи, която е дърво,
но в общия случай може да представлява граф;
Служи за представяне на структурата и семантиката на
данните.
Моделите на XML данните и RDF данните са различни
Моделът на RDF данните:
е граф (съвкупност от субект/предикат/обект изрази);
служи за представяне на семантиката на данните;
е абстрактен модел с няколко формати за
сериализиране, един от които е RDF/XML.
13 13 Цветанка Георгиева Моделиране на информационни системи
СРАВНЯВАНЕ НА RDF С РЕЛАЦИОННИ БАЗИ ОТ
ДАННИ
RDF данните могат да бъдат представени с помощта на
релационния модел.
Отделните твърдения в RDF се изразяват като триплети от
субект, предикат, обект.
Множества от триплети с общ предикат могат да бъдат
съпоставени с бинарните връзки в релационния модел чрез
таблица от две колони.
14 14 Цветанка Георгиева Моделиране на информационни системи
СРАВНЯВАНЕ НА RDF С РЕЛАЦИОННИ БАЗИ ОТ
ДАННИ
В релационния модел, даден ред в таблица всъщност
представлява твърдението, че релацията е валидна за
стойностите в реда.
Една SELECT заявка избира твърдения, които са верни за
дадените условия.
Релационната СУБД поддържа логически съгласуваността
между всички данни, които съдържа.
По този начин релационната база от данни може да се
разглежда като машина за разсъждения (reasoning engine).
15 15 Цветанка Георгиева Моделиране на информационни системи