- Регистрация
- 9 Май 2015
- Сообщения
- 1,486
- Баллы
- 155
Специалисты компании Anthropic, разрабатывающей семейство больших языковых моделей (LLM) Claude, опубликовали исследование, которое демонстрирует, что LLM можно принудить выполнять запрещенные действия, повторяя промпты на разный лад, а также автоматизировав этот процесс.