Исследователи показали, что ИИ можно джейлбрекнуть с помощью повторения промптов

Оффлайн

Sascha

Заместитель Администратора

Команда форума

Администратор

25 Дек 2024

Специалисты компании Anthropic, разрабатывающей семейство больших языковых моделей (LLM) Claude, опубликовали исследование, которое демонстрирует, что LLM можно принудить выполнять запрещенные действия, повторяя промпты на разный лад, а также автоматизировав этот процесс.

Пожалуйста Авторизируйтесь или Зарегистрируйтесь для просмотра скрытого текста.