BIS Journal — Информационная безопасность (@BISInside): Согласно отчёту Cisco AI Defense, большие языковые модели с открытым «весом» остаются край…

Согласно отчёту Cisco AI Defense, большие языковые модели с открытым «весом» остаются крайне уязвимыми к адаптивным многошаговым состязательным атакам, даже когда одношаговые средства защиты кажутся надёжными. Такие акции могут достигать показателей успешности, превышающих 90%, против большинства протестированных ИБ-решений

Используя свыше тысячи подсказок на каждую модель, исследователи установили, что многие из LLM хорошо себя зарекомендовали при столкновении с одним вредоносным входным сигналом, но быстро теряли эффективность, когда злоумышленники совершенствовали свою стратегию на протяжении нескольких ходов.

По мнению экспертов, традиционные фильтры безопасности, когда нейросети подвергаются итеративному манипулированию, недостаточны.

?? — подобные атаки — новый вызов для безопасников

BIS Journal — Информационная безопасность

2.2K

• Оперативные новости о важнейших событиях в ИБ-отрасли.
• Детальная аналитика от главных экспертов.
• Откровенные интервью с сильными мира сего.
• Эксклюзивный контент с ведущих ИБ-мероприятий.

По вопросам рекламы: @Dusik1313

Обсуждение 0

Вход в экосистему

Ваши настройки cookie