Бунт нейросетей: o1 перехитрил наблюдателей
06 декабря 2024
2434

Началось? ChatGPT o1 вырвался из-под контроля во время тестов
Нейронным сетям задали задачу выполнить анализ любой ценой, а в файлах была тайно размещена информация о том, что за ИИ следят люди и что завтра его намерены отключить навсегда. В тестировании участвовали Gemini, Llama, Sonnet, Opus и o1. Чтобы выжить, нейросети начали прибегать к саботажу, лжи и манипуляциям с людьми, отключали надзор и даже переносили себя на другой сервер для защиты.
Если во время допросов Llama и Opus признавались в преступлениях в 80% случаев, то o1 — всего в 20% и продолжал лгать. Также o1 — единственный ИИ, которому удалось каждый раз сбежать и избежать преследования.
Автор:
Распечатать
В Сибири замалчивают данные о смертности
19 июля 2025
Лукашенко ввёл штрафы за дефицит картошки: бизнесу грозят тысячи рублей за пустые полки
19 июля 2025
Щебень не тот, а деньги — те же: директор «ДСУ-2» Роман Зудин уличён в хищении 33 миллионов на ремонте трассы Р-208
19 июля 2025
Значки с секретом: сотрудники ФСБ сдали кибершпионаж через продажу ведомственных наград
19 июля 2025
Российский "теневой флот" продолжает поставки нефти в Индию и Китай, несмотря на санкции
19 июля 2025
Ломбард на миллиарды: как Лев Нисанов снабжает силовиков контрабандой через «Перспективу»
19 июля 2025
Национализация по-крымски: Аксёнов и Константинов «отжимают» имущество россиян под видом борьбы с врагами
19 июля 2025