avatar
Машинное обучение RU
вчера, 15:10
Tencent выкатил переводчик, который помещается почти куда угодно

Tencent Hunyuan открыли Hy-MT2 - серию мультиязычных моделей для перевода с Dense и MoE-вариантами.

Главная фишка не в том, что это «ещё одна модель для перевода». Самое интересное - маленькая версия на 1.8B параметров.

Её ужали через AngelSlim до 1.25-bit, и теперь модель занимает всего 440 МБ. При этом на Apple A15 она работает в 1.5 раза быстрее, чем обычный 4-bit inference.

То есть нормальный on-device перевод уже не выглядит как фантазия, где нужно жертвовать либо скоростью, либо размером.

Что заявляют по моделям:

• поддержка 33 языков и 5 китайских диалектов
• версия 1.8B обходит Microsoft Translate и другие коммерческие API на FLORES-200
• версии 7B и 30B-A3B обходят DeepSeek-V4-Pro
• 7B достигает 97.9% от уровня Gemini 3.1 Pro Think
• 30B-A3B достигает 98.6% от уровня Gemini 3.1 Pro Think
• все три модели показывают 96-99% от Gemini 3.1 Pro Think на реальных и доменных бенчмарках

Плюс Tencent вместе с моделями открыли IFMTBench - бенчмарк для проверки того, насколько хорошо переводческие модели следуют инструкциям.

🤖 https://modelscope.ai/collections/Tencent-Hunyuan/Hy-MT2
1
27 341
avatar
Машинное обучение RU
Переслано от Machinelearning
19.05.2026 17:39
Google выкатили сразу два больших релиза: Gemini Omni и Gemini 3.5 Flash

Похоже, Google снова пытается перехватить повестку в ИИ.

Первый релиз - Gemini Omni. Это семейство мультимодальных моделей, которые работают почти со всем сразу: текстом, кодом, изображениями, видео и даже виртуальными мирами.

Модель может принимать разные типы контента и не просто «понимать» их, а редактировать, дополнять и превращать в новые форматы:

- добавить эффекты в видео со смартфона
- сделать картину из грубого наброска
- собрать образовательный подкаст по фото
- работать с кодом, текстом, визуалом и видео в одном контексте

Первая модель семейства - Gemini Omni Flash - должна стать доступна уже сегодня.

Второй релиз - Gemini 3.5 Flash.

Google называет её своей самой сильной моделью для агентов и кодинга. Главное отличие - не просто быстрые ответы, а способность планировать работу по большим кодовым базам, рассуждать на длинной дистанции и запускать subagents параллельно.

По словам Google DeepMind, Gemini 3.5 Flash обходит 3.1 Pro на agentic и coding-бенчмарках вроде Terminal-Bench 2.1, GDPval-AA и MCP Atlas, при этом стоит заметно дешевле фронтирных моделей.

Если коротко:

- Gemini Omni - модель для всего: текст, код, картинки, видео, миры
- Gemini 3.5 Flash - ставка на агентов, кодинг и работу с большими проектами


Интересно, насколько хорошо модель будет работать как исполнитель: в IDE, браузере, видео, агентных workflow и реальных продуктах.

Релиз https://x.com/GoogleDeepMind/status/2056786446636212467

Попробовать: https://gemini.google.com/app
👍 2
🥰 2
🤬 1
9 306
avatar
Машинное обучение RU
Переслано от Machinelearning
19.05.2026 17:32
Google выкатили сразу два больших релиза: Gemini Omni и Gemini 3.5 Flash

Похоже, Google снова пытается перехватить повестку в ИИ.

Первый релиз - Gemini Omni. Это семейство мультимодальных моделей, которые работают почти со всем сразу: текстом, кодом, изображениями, видео и даже виртуальными мирами.

Модель может принимать разные типы контента и не просто «понимать» их, а редактировать, дополнять и превращать в новые форматы:

- добавить эффекты в видео со смартфона
- сделать картину из грубого наброска
- собрать образовательный подкаст по фото
- работать с кодом, текстом, визуалом и видео в одном контексте

Первая модель семейства - Gemini Omni Flash - должна стать доступна уже сегодня.

Второй релиз - Gemini 3.5 Flash.

Google называет её своей самой сильной моделью для агентов и кодинга. Главное отличие - не просто быстрые ответы, а способность планировать работу по большим кодовым базам, рассуждать на длинной дистанции и запускать subagents параллельно.

По словам Google DeepMind, Gemini 3.5 Flash обходит 3.1 Pro на agentic и coding-бенчмарках вроде Terminal-Bench 2.1, GDPval-AA и MCP Atlas, при этом стоит заметно дешевле фронтирных моделей.

Если коротко:

- Gemini Omni - модель для всего: текст, код, картинки, видео, миры
- Gemini 3.5 Flash - ставка на агентов, кодинг и работу с большими проектами


Интересно, насколько хорошо модель будет работать как исполнитель: в IDE, браузере, видео, агентных workflow и реальных продуктах.

Релиз https://x.com/GoogleDeepMind/status/2056786446636212467

Попробовать: https://gemini.google.com/app
3
7 461
avatar
Машинное обучение RU
@machinelearning_ru
19.05.2026 12:04
🚀 Примеры использования Cursor SDK для разработки

Репозиторий содержит небольшие примеры для работы с Cursor SDK на TypeScript. Он позволяет интегрировать кодирующего агента в ваши приложения, управлять состоянием и взаимодействовать с агентами в облаке и локально.

🚀 Основные моменты:
- Примеры для создания агентов и работы с API.
- Веб-приложение для быстрой разработки и тестирования.
- Канбан-доска для управления агентами и артефактами.
- CLI для запуска агентов из терминала.

📌 GitHub: https://github.com/cursor/cookbook
14 1K
avatar
Машинное обучение RU
@machinelearning_ru
15.05.2026 12:39
emoji Intern-S2-Preview - эффективная научная мультимодальная foundation-модель на 35B параметров.

1. Показывает качество, сопоставимое с trillion-scale моделью Intern-S1-Pro на ключевых научных задачах.

2. Первая open-source модель с возможностью генерации кристаллических структур материалов и сильными общими способностями.

3. Значительно усиливает возможности научных агентов на нескольких бенчмарках.

4. Повышает MTP acceptance rate и скорость генерации токенов за счёт shared-weight MTP + KL loss.

5. CoT compression сокращает ответы, сохраняя сильное рассуждение, что улучшает и качество, и эффективность.

Теперь поддерживается vLLM и SGLang. В будущем обещают больше интеграций с экосистемой.

Модель:
https://huggingface.co/collections/internlm/intern-s2

ModelScope:
https://modelscope.cn/collections/Shanghai_AI_Laboratory/Intern-S2

GitHub:
https://github.com/InternLM/Intern-S1

Попробовать:
https://chat.intern-ai.org.cn
👍 4
3
🔥 3
35 1.6K
avatar
Машинное обучение RU
@machinelearning_ru
15.05.2026 11:00
🧠 Mercury: Soul-Driven AI Agent

Mercury — это умный AI-агент, который запрашивает разрешения перед выполнением действий и запоминает важные детали. Он работает 24/7 через CLI или Telegram, имеет 31 встроенный инструмент и расширяемые навыки, а также память на основе SQLite.

🚀 Основные моменты:
- Запрашивает разрешения перед выполнением команд.
- Обладает структурированной памятью с автоэкстракцией.
- Легко настраивается и расширяется с помощью пользовательских навыков.
- Работает в фоновом режиме и автоматически перезапускается при сбоях.
- Поддерживает многоканальный доступ через Telegram и CLI.

📌 GitHub: https://github.com/cosmicstack-labs/mercury-agent

#javascript
GitHub
GitHub - cosmicstack-labs/mercury-agent: Soul-driven AI agent with permission-hardened tools, token budgets, and multi-channel access. Runs 24/7 from CLI or Telegram.
Soul-driven AI agent with permission-hardened tools, token budgets, and multi-channel access. Runs 24/7 from CLI or Telegram. - cosmicstack-labs/mercury-agent
🔥 3
2
👍 2
45 1.5K
Пользователи твиттера разгромили картину Клода Моне, так как поверили, что это генерация ИИ:

> Чувак под ником SHL0MS написал, что сгенерировал картину в стиле Моне, и попросил подробно рассказать, чем она уступает настоящему Моне

> Диванные искусствоведы начали критиковать работу со светом, деталями, цветами и так далее

> В итоге оказалось, что это не генерация ИИ, а настоящая картина Клода Моне из цикла «Кувшинки»
😁 17
3
👏 3
22 1.2K
avatar
Машинное обучение RU
@machinelearning_ru
14.05.2026 15:13
Just AI Agent Platform теперь доступна в облаке.

Раньше такие платформы чаще были историей для крупного enterprise: долгий запуск, отдельная инфраструктура, большой бюджет на внедрение. Теперь всё проще - зарегистрировался и можно сразу собирать AI-агентов под свои задачи.

Это low-code-платформа, где агентов можно настраивать в конструкторе без полноценной разработки с нуля. Удобно, если нужно быстро проверить гипотезу, собрать прототип и понять, где автоматизация реально даёт пользу бизнесу.

Что можно делать:

• обрабатывать обращения клиентов

• собирать внутренних помощников для сотрудников

• автоматизировать рутину в отделах

• подключать базы знаний через RAG

• интегрироваться с внутренними системами

• использовать разные LLM-модели под конкретные сценарии

Агентные сценарии можно тестировать быстрее, дешевле и без необходимости сразу запускать большой проект разработки.

Попробовать тут

Реклама. ООО «Маинд Крафт», ИНН: 7813286694, erid:2VtzqwzrhUj
🤔 1
24 1.3K
avatar
Машинное обучение RU
@machinelearning_ru
14.05.2026 07:38
Python 3.15 beta 1 вышла в релиз 🐍

Это значит, что крупные фичи для релиза фактически зафиксированы. Дальше - бета, тесты, багфиксы и подготовка к финальному релизу.

Что интересного в 3.15:
- lazy imports через ключевое слово lazy
- встроенные frozendict и sentinel
- JIT стал быстрее на x86-64 Linux
- распаковка прямо внутри comprehensions
- новый статистический profiler с низким overhead
- frame pointers включены по умолчанию

Python 3.15.0b1 вышел 7 мая 2026 года, это первая из четырёх запланированных beta-версий и точка feature freeze; финальный релиз запланирован на 1 октября 2026 года.

https://blog.python.org/2026/05/python-3150-beta-1/
👍 4
1
13 1.3K
avatar
Машинное обучение RU
@machinelearning_ru
13.05.2026 10:10
Новый репозиторий Anthropic: Claude for Legal.

Это набор готовых AI-workflow для юридических команд.

Внутри сценарии для работы с:

• контрактами
приватностью
• трудовым правом
• судебными спорами
• корпоративными задачами
• интеллектуальной собственностью
• AI governance
• мониторингом регулирования
• юридическими клиниками
• студентами-юристами

Ссылка:
https://github.com/anthropics/claude-for-legal
3
👍 3
🔥 2
51 1.4K
avatar
Машинное обучение RU
Переслано от Machinelearning
13.05.2026 06:36
emoji Конгресс США начал расследование против Сэма Альтмана

Комитет по надзору Палаты представителей США направил официальное письмо Сэму Альтману с требованием раскрыть детали его личных инвестиций и финансовые связи с топ-менеджментом.

Власти подозревают, что ресурсы OpenAI могли использоваться для искусственного завышения капитализации компаний, в которых CEO имеет личную долю.

Главным поводом для расследования стала ситуация вокруг разработчика термоядерных реакторов Helion.

В 2021 году Альтман вложил в него $375 млн из собственных средств, а позже предложил OpenAI инвестировать в проект еще $500 млн. Эта сделка могла увеличить оценку Helion в шесть раз - до $35 млрд.

Согласно документам комитета, сотрудники OpenAI были настолько встревожены инициативой, что избегали ее обсуждения в корпоративном Slack из-за страха перед возможным судебным преследованием.

Расследование также выявило непубличные связи внутри руководства компании: выяснилось, что президент OpenAI Грег Брокман владеет долями в двух стартапах Альтмана и имеет процент в его семейном фонде.

Конгресс обязал OpenAI до 22 мая провести брифинг с участием главного юрисконсульта и предоставить всю внутреннюю переписку с 2015 года, касающуюся конфликтов интересов.

Отдельно законодатели запросили доступ к отчета аудиторского комитета, созданного советом директоров OpenAI после скандального увольнения и возвращения Альтмана в 2023 году.


@ai_machinelearning_big_data

#news #ai #ml
👍 4
2
🔥 1
9 1.2K