TR 41-2015 Метрики качества данных - Стандарты и спецификации PDF

TR 41-2015
Метрики качества данных

Стандартный №
TR 41-2015
Разместил
SG-SPRING SG1
Последняя версия
TR 41-2015
сфера применения
В этом наборе рекомендаций сформулирован и определен общий набор показателей качества данных, не зависящих от предметной области, для структурированных и машиночитаемых наборов данных. Данные могут включать:  ——Исторические данные, содержащие прошлую информацию (например, библиотечные книги, записи транзакций);  ——Живые данные, содержащие текущую информацию (например, наличие книг в библиотеке). Данные могут быть доступны в виде:  ——точечных данных, которые собираются или записываются время от времени через некоторые дискретные интервалы времени, или - потока данных, который включает в себя непрерывные, устойчивые потоки или последовательность информации. Примеры включают цены на акции, потоки рыночных данных, сенсорные каналы и видеопотоки. Показатели качества данных для неструктурированных наборов данных в настоящее время выходят за рамки этого документа, и предлагаемые рекомендации могут быть применимы или неприменимы к неструктурированным наборам данных. Отраслевой агностицизм и общность являются фундаментальными проблемами в процессе отбора для включения в базовый набор показателей качества. Хотя другие показатели могут служить примером качества данных в наборах данных, используемых в некоторых отраслях, если их нелегко применить повсеместно, они не включены в эти рекомендации. Поставщикам данных, однако, рекомендуется принять методологию, описанную в разделе 4.2 «Методология цели-вопроса-метрики», для разработки дополнительных показателей, которые помогают передать определенные аспекты качества данных, которые помогают потенциальным покупателям в их оценке предлагаемого набора данных. Нижеследующее выходит за рамки Технического справочника:  ——Показатели, которые подлежат интерпретации или решают проблемы, составляющие часть процесса оценки покупателя, также выходят за рамки настоящих рекомендаций. - Метрики, полученные из более чем одной базовой метрики, где метод расчета или вывода может варьироваться в зависимости от потребностей пользователя, также не включены. Например, соотношение непустых записей к максимально возможному количеству записей может указывать на полноту или обширность набора данных. Однако, поскольку для определенных типов наборов данных может не быть максимального или ожидаемого количества записей, пользователи, оценивающие набор данных, должны будут контекстуализировать опубликованные показатели в соответствии со своими требованиями и ожиданиями. - Рекомендации о способах применения опубликованных показателей для ответа на вопросы более высокого порядка, относящиеся к качеству данных. Следует отметить, что некоторые из включенных показателей не являются неотъемлемой частью данных, например, стоимость доступа и поддержка. Тем не менее, они были включены как часть руководящих принципов, поскольку они являются важными факторами и предоставляют полезные индикаторы осуществимости набора данных для пользователя.

TR 41-2015 История

  • 1970 TR 41-2015 Метрики качества данных
  • 1987 TR 41-1987 Язык спецификации документа



© 2023. Все права защищены.