avatar
Молянов
@molyanov_blog
20.02.2026 00:48
Сделал скилл для Claude Code, который берет уже существующий скилл (например, по написанию кода, или по ведению задач в таск-менеджере), придумывает под него тестовые задания и критерии оценки.

Затем прогоняет эти задания на пачке ничего не подозревающих субагентов. Смотрит, как они отработали, находит косяки, составляет отчет, где агенты тупят, формулирует гипотезы, как улучшить исходный скилл, чтобы этот тупняк починить.

От меня тут надо только точно указать, какой результат я хочу получить на выходе и как его провалидировать

Потестирую недельку, и если все будет ок, то полностью зациклю процесс — чтобы скилл автоматически улучшался до тех пор, пока не будет выполнять задачу на 100% верно.
🔥 60
👀 35
10
👍 2
😱 2
💩 2
2
24 70 5.5K

Обсуждение 24

Обсуждение не доступно в веб-версии. Чтобы написать комментарий, перейдите в приложение Telegram.

Обсудить в Telegram