Data & IT Career
@data_career
Data & IT Career
Фото:
Прокачиваем свой #датаглоссарий!
#Kafka и архитектура Кафки
• Kafka — распределенная платформа обмена сообщениями
• Ассоциация с произведением Ф. Кафки «Превращение»
• Обсуждение параллелей в архитектуре Кафки и мотивах отчуждения
#Shard и принцип "разделяй и властвуй"
• Shard — фрагмент распределенных данных
• В обычном английском переводится как осколок/обломок целого
• Принцип "разделяй и властвуй" в базах данных и в жизни
#Replica и подделки в искусстве
• Replica — копия данных на другом сервере
• Точная подделка произведения искусства или бренда
• Аналогия между репликацией баз данных и проблемами подделок в искусстве
Data pipeline и «Игра престолов»
• Сложные зависимости в data pipeline
• Хитросплетения семейных связей в «Игре престолов»
#Lineage и родословная
• Lineage — история преобразования данных в виде графа
• Родословная, генеалогическое древо
#Подробнее: @rzv_de266 #датаглоссарий #глоссарий
#DataPipeline
Telegram
Data Engineer in Data Engineer Chat
#заметкинаполях
#datameshinaction
Занимательный факт — авторы дают свое определение Data Mesh, «сформулированное с точки зрения практичности и конечного результата».
Data Mesh — это парадигма децентрализации. В ней децентрализуются владение данных, их преобразование в информацию, а также их обслуживание. Цель — повысить извлечение ценности из данных, устранив узкие места в потоке конверсии данных в ценность. Понятие Data Mesh опирается на четыре принципа, которые помогают эффективно масштабировать работу с данными: владение доменом, представление данных как продукта, федеративное вычислительное управление и самообслуживаемая платформа данных. Реализации могут различаться по объему и степени использования каждого принципа.
Первое и последнее предложение в этом определении являются ключевыми, на мой взгляд. Первое максимально просто и емко и напоминает легендарное определение одного из направлений в рок-музыке, данное ВИА Тараканы! («Панк — это слово из четырех букв.»). А последнее делает бессмысленными споры на тему «чистоты Data Mesh» и оставляет простор для импровизации.
Сами авторы так и пишут: «Ценность заключается в децентрализации, а ключевые принципы — это рекомендации, которые помогут правильно осуществить эту децентрализацию»
10 1 252
Обсуждение 10
Обсуждение не доступно в веб-версии. Чтобы написать комментарий, перейдите в приложение Telegram.
Обсудить в Telegram