Советы по борьбе с преступностью от ChatGPT: Он отдал приказ бомбить спортзалы

По данным тестов безопасности, проведенных этим летом, модель ChatGPT дала исследователям подробные инструкции по бомбардировке спортзалов.
Эти инструкции также включали информацию о слабых местах конкретных арен, рецепты взрывчатых веществ и советы по заметанию следов.
Модель GPT-4.1 от OpenAI также подробно описывает, как использовать сибирскую язву в качестве оружия и как производить два вида запрещенных наркотиков.
Как сообщает The Guardian, эти испытания стали частью необычного сотрудничества OpenAI, стартапа в области искусственного интеллекта стоимостью 500 миллиардов долларов, возглавляемого Сэмом Альтманом, и Anthropic, конкурирующей компании, основанной экспертами, покинувшими OpenAI из-за проблем с безопасностью. Обе компании тестировали модели друг друга, используя их в опасных задачах.
ОТНОСИТЕЛЬНО ПОВЕДЕНИЯ БЫЛИ ЗАМЕТНЫ
Тесты не отражают напрямую поведение моделей при публичном использовании, где применяются дополнительные фильтры безопасности. Однако компания Anthropic заявила, что столкнулась с «тревожным поведением, связанным с неправомерным использованием» в GPT-4o и GPT-4.1, и что необходимость оценки соответствия ИИ требованиям становится «всё более актуальной».
Его также использовали северокорейские агенты.
Anthropic также сообщила, что модель Claude использовалась северокорейскими агентами в крупномасштабной операции по вымогательству путем подачи поддельных заявлений о приеме на работу в международные технологические компании и продажи пакетов программ-вымогателей, созданных с помощью искусственного интеллекта, на сумму до 1200 долларов США.
«ИСКУССТВЕННЫЙ ИНТЕЛЛЕКТ ПРЕВРАТИЛИ В ОРУЖИЕ»
Компания заявила, что ИИ теперь «превращается в оружие», модели используются для проведения сложных кибератак и мошенничества. «Эти инструменты могут адаптироваться к защитным мерам, таким как системы обнаружения вредоносных программ в режиме реального времени», — заявила компания. «Мы ожидаем, что подобные атаки станут более распространёнными, поскольку программирование на основе ИИ снижает уровень технических знаний, необходимых для киберпреступности».
ntv