avatar
Клуб CDO
@cdo_club
20.08.2025 14:20
Сегодня хочу поделиться статьей про онтологии данных и управление знаниями. Мне кажется, эта тема интересная, хотя в последнее время я не замечаю большого количества материалов по ней. На мой взгляд, некоторое время назад (не берусь сказать, сколько лет) возникло разочарование в идее представлять значения людей в виде графовой структуры на основе как универсальных, так и локальных онтологий. Думаю, это связано с тем, что такие онтологии опираются только на эмпирические знания экспертов и требуют значительных трудозатрат на разработку и классификацию, в ходе которых постоянно возникают трудности из-за неоднозначности и множественности значений наших человеческих понятий и терминов.

Тем не менее сейчас всё чаще замечаю, что в области RAG и других попыток “поженить” LLM с личными или корпоративными данными подходы к графовому представлению знаний становятся всё более успешными. Например, метод GraphRAG, разработанный Microsoft Research (не самой любимой компанией в этом сообществе), показывает очень хорошие результаты.

Хотя новые подходы основаны на том, что граф знаний строится самой LLM и, по сути, она создаёт и онтологию — путём классификации и кластеризации данных, — но из-за сложности такой граф становится практически недоступен для понимания человеком, если данных слишком много.

В общем, предлагаю немного освежить тему онтологий данных и управления знаниями по этой статье, в которой автор анализирует основные заблуждения в области Linked Data и онтологий, мешающие развитию современных систем управления знаниями, а именно:

- Многие знания и графы данных недоступны или устарели, несмотря на впечатляющие визуализации Linked Data.
- Рекомендация использовать готовые онтологии часто приводит к проблемам поддержки и несовместимости, поэтому лучше создавать собственные модели с возможностью трансформации между ними.
- Не все онтологии должны быть глобальными — локальные, специализированные модели зачастую эффективнее.
- Инференция (вывод новых знаний на основе правил) становится менее актуальной благодаря развитию SPARQL и SHACL, которые позволяют реализовать бизнес-логику на уровне запросов и валидации.
- Рефикация (описание утверждений как объектов) и именованные графы раньше считались сложными и неэффективными, но новые стандарты (RDF-Star) и подходы делают их полезными для современных задач.
- Создавать онтологии могут не только специалисты — современные инструменты (например, SHACL) делают моделирование данных доступным для широкой аудитории.

https://ontologist.substack.com/p/why-its-time-to-rethink-linked-data
Substack
Why It's Time To Rethink Linked Data
Or How To Piss Off an Ontologist or Three
? 5
? 1
1 38 1.4K

Обсуждение 1

Обсуждение не доступно в веб-версии. Чтобы написать комментарий, перейдите в приложение Telegram.

Обсудить в Telegram