Kimi k2.5 Review: Native Multimodality and Agent Swarms at 1 Trillion Parameters
У меня дошли руки почитать Kimi K2.5, и я считаю, что это один из самых интересных agentic + multimodal релизов за последнее время.
Что оказалось самым интересным
— Это native multimodal модель: текст и vision обучаются совместно с самого начала, а не «прикручиваются» в конце.
— Визуальный RL улучшает текстовое рассуждение - это неожиданно.
— Agent Swarm — обучаемая система параллельных агентов, которая мощно снижает latency (4–5ч) и масштабирует сложные задачи.
Учитывая, что в Claude Code уже завезли Agent Swarm и я их пощупал ручками, мне было любопытно почитать откуда они взялись.
Paper
Code
Project
Мои обзоры:
Personal blog
Medium
Linkedin
#paperreview
Обсуждение 0
Обсуждение не доступно в веб-версии. Чтобы написать комментарий, перейдите в приложение Telegram.
Обсудить в Telegram