avatar
дата инженеретта
@data_engineerette
20.02.2025 17:17
Про качество данных

В конце прошлого года я зачитывалась книжками. И в одной из них мне понравилось выражение, что данные - это "тихий убийца".
Мы можем даже не понимать, что они некачественные, но в какой-то момент это вырелит.

Был кейс, когда одна команда сделала финансовую отчетность на основе некорректных данных и направила куда-то выше. В этой отчетности цифры были сильно меньше, чем потратили. И встал вопрос - а куда делись все остальные средства? Так что это может довести до серьезных послий.

??? А вообще качество данных - это очень хрупкая вещь.

Где может пой
тне так?
??при выгрузке из источника (поставили лишнифильтр)
??при передаче между системами (все задублировалось, потеряли куски инрмации)
??при интеграции нескольких источников (не на все данные прописаны правила сопосвления)
??при анализе (неправильно посчитали)

А это очень милая и грустная аномалия в контексте целостностданных:
??сироты - когда в
нешние ключи никуда не ведут

Каждый, кто прикасается к данным, способен повлиять на их качество. Обеспечение качества данных — предмет заботы всей организации, а не только к

ом
анды качества данных или ИТ.

Руководство данными нужно для того, чтобы «делать правильные вещи» (Doing the right things), а управление данными — для того, чтобы «делать вещи п

равильно» (Doing things right)

#data_dmbok #fundamentals_of_de
? 35
? 11
? 6
20 27 3.2K

Обсуждение 20

Обсуждение не доступно в веб-версии. Чтобы написать комментарий, перейдите в приложение Telegram.

Обсудить в Telegram