Китайский стартап DeepSeek выпустил превью-версии новой флагманской ИИ-модели V4.
DeepSeek назвал ее
самой мощной моделью с открытым исходным кодом, отметив высокие результаты V4 в программировании и значительный прогресс в областях рассуждений (reasoning) и выполнения агентских задач.
Модель имеет две линейки - V4 Flash и V4 Pro. В них реализованы архитектурные и оптимизационные улучшения, сообщила компания на платформе Hugging Face.
Бюджетная Flash имеет 284 млрд параметров, включая 13 млрд активных, продвинутая Pro - 1,6 трлн параметров (49 млрд активных), говорится в ее сообщении в соцсети X.
Версия Pro сопоставима по результатам с лучшими мировыми моделями с закрытым кодом, заявляет DeepSeek. При этом стоимость ее эксплуатации (инференса) значительно ниже, чем у аналогов.
@interfaxonline
Обсуждение 0
Обсуждение не доступно в веб-версии. Чтобы написать комментарий, перейдите в приложение Telegram.
Обсудить в Telegram