avatar
дата инженеретта
@data_engineerette
09.04.2026 08:34
Копаемся в метасторе

Вы когда-нибудь заглядывали, что на самом деле хранится в базенке хайв метастора? Там создаются системные таблицы с инфой по базам, таблицам, путям, колонкам и еще много всего

Из наиболее полезных таблиц я для себя выделила:

COLUMNS_v2 - о колонках
CTLGS - о каталогах
DBS - о схемах
ROLES - о ролях
SDS (Storage Descriptors) - о путях к таблицам
TABLE_PARAMS - о свойствах таблиц
TBLS - о таблицах

И на основе этого мы можем вывести сводную инфу по всем схемам, таблицам, полям:


SELECT
d."NAME",
t."TBL_NAME",
t."OWNER",
s."LOCATION",
c."COLUMN_NAME",
c."TYPE_NAME",
c."COMMENT"
FROM "TBLS" as t
JOIN "DBS" d
ON t."DB_ID" = d."DB_ID"
JOIN "SDS" s
ON t."SD_ID" = s."SD_ID"
JOIN "COLUMNS_V2" c
ON s."CD_ID" = c."CD_ID"
--WHERE d."NAME" = 'raw'
--AND t."TBL_NAME" = 'test'
ORDER BY d."NAME", t."TBL_NAME", c."INTEGER_IDX";


А на этой картинке представлена ER-диаграмма модели данных

@data_engineerette
🔥 16
9 12 2K

Обсуждение 9

Обсуждение не доступно в веб-версии. Чтобы написать комментарий, перейдите в приложение Telegram.

Обсудить в Telegram