avatar
Kumar & Solo
@solokumi
19.09.2025 10:09
БИТВА нейронок друг с другом!

Сравнение Chat GPT vs Grok vs Manus vs Gemini vs Claude

По нашим наблюдениям, большинство из вас для 90% своих задач юзает ChatGPT, но прикол в том, что если сравнить качество выдаваемых ответов на разные задачи, используя один и тот же промпт, ChatGPT вообще далеко не всегда лидер по качеству.

Так что мы решили провести батл между LLMками в решении частых задачек, чтобы понять в каких кейсах что лучше использовать

I. Копирайт (на примере текста + идеи рекламного креатива)
Промпт:
Ты - опытный креативный директор и копирайтер, специализирующийся на образовательных продуктах для детей. Сейчас ты работаешь с компанией. ## О КОМПАНИИ
Даем данные:
RTB:
Про продукт:
ЦА:
TOV:

## ЗАДАЧА
Создай концепцию и текст для рекламного баннера в Facebook*, нацеленной на привлечение новых клиентов в продукт (описать)

Требования к рекламе:
1. Создай 3 варианта креативной концепции с разными подходами
2. Для каждой концепции разработай:
- Основной заголовок (до 10 слов)
- Подзаголовок (до 15 слов)
- Основной текст (до 100 слов)
- Призыв к действию
- Концепцию визуального оформления
3. Используй психологические триггеры
4. Фокусируйся на пользе для ребенка и спокойствии родителей
5. Включи элемент срочности (ограниченное количество мест)
В финале рекомендуй лучшую концепцию с обоснованием выбора.


Результаты: Chat GPT (5.0), Grok (4.0), Manus, Gemini (2.5 pro), Claude (opus 4.1)

Победитель: Claude, при чем просто всмятку. Единственный подумал, что цену не надо пихать в лоб на креатив, сделал самый сильный оффер и сам текст выглядит нативно

II. Сделать архитектуру AI агента (на примере агента для трендвотчинга)

Промпт:
Ты - опытный разработчик автоматизаций на платформе n8n с глубоким пониманием интеграций с социальными сетями и анализа данных. Тебе поручена задача разработать детальный флоу в n8n для автоматизации процесса трендвотчинга в СММ.

## КОНТЕКСТ ЗАДАЧИ

Трендвотчинг в СММ - это систематический процесс мониторинга и анализа популярного контента конкурентов для выявления паттернов успешных публикаций и последующего создания собственного вирального контента на их основе.

### Бизнес-процесс:
1. Мы имеем базу аккаунтов конкурентов в таблице
2. Нам нужно регулярно парсить их видео, которые набрали более 50,000 просмотров
3. Анализировать эти видео по ряду параметров
4. Сохранять результаты в структурированном виде для дальнейшего использования

Продолжение тут: ссылка

Результаты: Chat GPT (5.0), Grok (4.0), Manus, Gemini (2.5 pro), Claude (opus 4.1)

Тут победил ChatGPT, а особенно он лучше в том, чтобы входить в роль учителя и помогать решать баги во флоу и объяснять все в роли наставника.

III. Изучение разных источников + создание отчета

Промпт максимально простой:
Найди мне лучшие практики по промптингу в 2025

Резалты: Chat GPT (5.0), Grok (4.0), Manus, Gemini (2.5 pro), Claude (opus 4.1)

Победа однозначно уходит Manus.

Многие все еще не до конца понимают в чем его прикол, так вот, это фактически не LLM, а агент, который в ответе сам принимает решение какую LLM использовать, может использовать несколько разных LLMок при решении задачи, искать по разным открытым источникам, показывает вам свой виртуальный "компьютер" во время всего процесса. И вот на наш взгляд он уделал чат гптишный Deep Research в несколько раз.

IV. Копирайт лендинга
Тут промпт

Резалты: Chat GPT (5.0), Grok (4.0), Manus, Gemini (2.5 pro), Claude (opus 4.1)

Claude победил, топ 1 LLM в копирайте на наш взгляд. Единственное, он сильно хуже помнит контекст и собирает контент по интернету, поэтому лучше ему отдавать инфо чисто на копирайт.

V. Анализ большого объема данных
Не поделимся исследованиями, так как вгружали гигантский обьем чувствительной информации, но скажем, что лучше всех ее обработал Gemini

Шерьте пост с друзьями и пишите в комменты, какие LLM для каких задач используете вы 🔥 (и кого схлестнуть в битве друг с другом в следующий раз)
78
🔥 39
👍 24
🥰 8
5
❤‍🔥 4
15 339 13.6K
* Принадлежит организации Meta, которая признана экстремистской и запрещена на территории РФ

Обсуждение 15

Обсуждение не доступно в веб-версии. Чтобы написать комментарий, перейдите в приложение Telegram.

Обсудить в Telegram

Kumar & Solo

36.3K
Роман Кумар Виас @KumiKingKong и Саша Соловьев @alexander_solovyev

Рассказываем, как строили глобальный бизнес (400 сотрудников, 2 страны, $13M+ за полтора года). Маркетинг, продажи, продукт и AI.
Открыть в Telegram