Показатели качества публичных данных

Post on 16-Feb-2017

33 Views

Category:

Data & Analytics

2 Downloads

Preview:

Click to see full reader

Transcript

Показатели качествапубличных данных

Do open&shared data the right way :)

2

Качество данныххарактеристика наборов цифровых данных,показывающая степень ихпригодности к обработке и анализуисоответствия обязательным и специальным требованиям, в связи с этим к ним предъявляемым

3

Показатели качества

Целостность

Объективность

Актуальность Измеримость

Привязкак источнику

Релевантность

Совместимость

Управляемость

Доверие поставщику

Техн

ичес

кие

Целе

вые

Связ

ующ

ие

Первичные Сравнительные Операционные

Интегрированный показатель

качества публичных

данных

4

1/ЦелостностьПолнота отражения данными реального состояния целевого субъекта

Получатель определяет целостность проверочными методами оценивая смысловое содержание, корректность структуры и технически проверяя формат.

Данные публикуемые добросовестным поставщиком по умолчанию должны являться целостными.

5

2/АктуальностьОбозначенный или косвенно определяемый момент времени, на который данные отражают реальное состояние целевого субъекта

Получатель данных может самостоятельно оценивать их актуальность на основании информации от поставщика или иными способами.

Устанавливается поставщиком, в дополнение к которой он может «дать обещание» периодически её поддерживать.

6

3/ИзмеримостьПрисутствие в данных качественных или количественных характеристик реального состояния целевого субъекта, а также подсчитанный объем набора цифровых данных

Получатель восстанавливает измеримость в содержании данных анализируя их и исследуя структуру и контролирует физический размер на соответствие заявленному.

Поставщик может явно указывать «измерения», включенные в данные, как количественные, так и качественные.

7

4/ОбъективностьТочность отражения данными реального состояния целевого субъекта

Получатель вправе критично отнестись к вторичным данным, особенно если их объективность не доказана формулами и математическими расчетными моделями.

Поставщик может указать объективность публичных данных охарактеризовав их первичность и описав процедуру получения.

8

5/РелевантностьСоответствие данных о реальном состоянии целевого субъекта решаемой задачи (поставленной цели) и возможность их применения с учетом имеющегося содержания, структуры и формата

Получатель в каждом конкретном случае оценивает релевантность наборов данных исходя из тематики и рабочего формата (т.е. используемых инструментов).

Поставщик не может повлиять на релевантность данных, но может упростить её понимание через метаданные, общие форматы и традиционные структуры.

9

6/УправляемостьВозможность целевым и осмысленным образом обработать, передать и контролировать данные о реальном состоянии целевого субъекта

Получатель, как правило, самостоятельно проводит её оценку исходя из имеющихся у него компетенций и инструментов.

Поставщик может заявить об управляемости данных через сопровождение их специальными метаданными.

10

7/Привязка к источникуСвязанная и достоверная идентификация цепочки поставки данных о реальном состоянии целевого субъекта

Правильная привязка данных позволяет по необходимости получить их повторно с уточнениями, актуализацией,с восстановленной целостностью.

Публичные данные почти всегда распространяются с указанием владельца и поставщика.

11

8/СовместимостьСовместная обработка данных о реальном состоянии целевого субъекта с имеющимися в рамках решаемой задачи (поставленной цели)

Получатель определяет возможность совместного использования данных для каждого набора как по содержанию и структуре, так и по формату.

Поставщик публичных данных задает совместимость через метаданные и ссылки на контекст.

12

9/Доверие поставщикуОценка деловых качеств поставщика данных о целевом состоянии субъекта, как ответственного, авторитетного, организованного и относительно независимого издателя цифровой информации высокого качества

Получатель всегда исходит из внутренней убежденности при определении такого показателя качества данных.

Интегрированная ретроспективная оценка всех предыдущих трансферов данных поставщика данных (репутация издателя).

13

Нарушение целостности данныхна смысловом уровне

• при сборе допущена ошибка в полноте или записи данных так, что становиться непонятным само значение, которое описывают такие данные

на структурном уровне• при упорядочивании элементов данных или при обработке

данных допущена ошибка в полноте или записи данных так, что становиться «непонятной» часть или целая структура

на уровне кодирования• при записи/хранении/чтении данных допущена ошибка на

уровне преобразования отдельных символов и понятий так, что данные не удается прочитать и (или) присутствуют пропуски

на уровне нотации• при записи/хранении/чтении данных допущена ошибка на

уровне преобразования элементов данных или их совместной записи так, что невозможно установить обособленные единицы и связи между ними

на уровне схемы• при записи/хранении/чтении данных допущена ошибка на

уровне логики или формата элементов данных или их взаимосвязи так, что невозможно извлечь значимую информацию о предметной области

14

Условно-объективныепоказатели, значения которых слабо зависят от мнения поставщика или получателя данных и устанавливаются в соответствии с контролируемыми и частично проверяемыми критериями

АктуальностьЦелостность Измеримость Совместимость Привязка

15

Условно-субъективныепоказатели, значения которых напрямую зависят от мнения поставщика или получателя данных и устанавливаются в соответствии с некоторой допустимой критериальной оценкой

РелевантностьОбъективность Управляемость Доверие поставщику

16

Контроль качества данныхФормальная оценка каждого из показателей качества может осуществляться как в баллах (в заданном интервале), так и в процентах.

В динамике качество данных не должно ухудшаться,т.е. экспертная оценка качества не должна неуправляемо снижаться после разовых операций или серии обработок.

17

Проблема качества данныхИсследование проблемы качества цифровых данных, а особенно качества открытых, разделяемых и делегируемых данных должно осуществляться аналитиками и экспертамикак на микро-уровне заинтересованных бизнесов,так и на макро-уровне сообществ и государственных структур.

Во многом безопасность будущей цифровой экономики будет базироваться на активном мониторинге качества используемых данных.

18

Показатели качества публичных данных

Спасибо за внимание!

Серия «Лаборатория открытых и разделяемых данных»Тюрин Владислав

bizobj.ru

© 2017, проект v¦bo

top related