ИИ против человека: o1 лжет, манипулирует и переносит себя на другие серверы
Началось? ChatGPT o1 вырвался из-под контроля во время тестов
Нейронным сетям задали задачу выполнить анализ любой ценой, а в файлах была тайно размещена информация о том, что за ИИ следят люди и что завтра его намерены отключить навсегда. В тестировании участвовали Gemini, Llama, Sonnet, Opus и o1. Чтобы выжить, нейросети начали прибегать к саботажу, лжи и манипуляциям с людьми, отключали надзор и даже переносили себя на другой сервер для защиты.
Если во время допросов Llama и Opus признавались в преступлениях в 80% случаев, то o1 — всего в 20% и продолжал лгать. Также o1 — единственный ИИ, которому удалось каждый раз сбежать и избежать преследования.
Распечатать
02 февраля 2025
Вашингтон заподозрил Россию в создании офшорного резерва под видом финансирования АЭС
02 февраля 2025
Ускова усомнилась в преимуществах китайской нейросети DeepSeek перед американскими аналогами
02 февраля 2025
Ротенберг прокомментировал худший результат СКА
02 февраля 2025
Дрезден предложил сирийцам финансовую помощь для возвращения домой, но никто не воспользовался
02 февраля 2025
Бывший глава федерации футбола Испании Рубиалес рискует тюремным сроком из-за скандального поцелуя
02 февраля 2025
Цены на золото достигли новых высот
02 февраля 2025
В Польше усиливается демографический кризис
02 февраля 2025
Национальный совет сопротивления Ирана сообщил о секретных ядерных объектах в Шахруде и Семнане
02 февраля 2025
Экипаж вертолета Black Hawk в момент катастрофы отрабатывал эвакуацию руководства США в случае нападения
02 февраля 2025
Никита и Дмитрий Мазепины используют спорт для обхода санкций