Про качество данных
В конце прошлого года я зачитывалась книжками. И в одной из них мне понравилось выражение, что данные - это "тихий убийца".
Мы можем даже не понимать, что они некачественные, но в какой-то момент это вы
релит.
Был кейс, когда одна команда сделала финансовую отчетность на основе некорректных данных и направила куда-то выше. В этой отчетности цифры были сильно меньше, чем потратили. И встал вопрос - а куда делись все остальные средства? Так что это может довести до серьезных посл
ий.
??? А вообще качество данных - это очень хрупк
ая вещь.
Где может пойт
не так?
??при выгрузке из источника (поставили лишни
фильтр)
??при передаче между системами (все задублировалось, потеряли куски ин
рмации)
??при интеграции нескольких источников (не на все данные прописаны правила сопос
вления)
??при анализе (неправильно посчитали)
А это очень милая и грустная аномалия в контексте целостност
данных:
??сироты - когда в
нешние ключи никуда не ведут
Каждый, кто прикасается к данным, способен повлиять на их качество. Обеспечение качества данных — предмет заботы всей организации, а не только к
ом
анды качества данных или ИТ.
Руководство данными нужно для того, чтобы «делать правильные вещи» (Doing the right things), а управление данными — для того, чтобы «делать вещи п
равильно» (Doing things right)
#data_dmbok #fundamentals_of_de
Обсуждение 20
Обсуждение не доступно в веб-версии. Чтобы написать комментарий, перейдите в приложение Telegram.
Обсудить в Telegram