Если вам интересно — вот так делаются теги для каждого поста на проекте
telega.fm. ИИ работает. Чуть больше деталей:
«Так, если коротко: берем пост, очищаем от всякого мусора в виде предлогов, числительных и так далее. Берем готовые теги, если они есть в посте. Если тегов не набралось шесть, пытаемся извлечь их самостоятельно. Прогоняем текст через алгоритм TextRank, определяем вес каждого слова на основе того, кто с кем рядом стоит; слово с большим весом придает больший вес стоящим рядом словам.
С помощью векторной близости ищем похожие посты и берем оттуда два тега. Объединяем всё вместе и получаем от 0 до 6 тегов».
MAX TG
Обсуждение 6
Обсуждение не доступно в веб-версии. Чтобы написать комментарий, перейдите в приложение Telegram.
Обсудить в Telegram