Нови AI системи демонстрират съпротива срещу деактивация

01 юни 2025 - 17:53 часа
Редактор: Мартин Руменов
Коментари: 0

0Одобрявам

Водещи AI системи демонстрират способност да заобикалят изключването и да прибягват до изнудване

Най-новите модели на изкуствен интелект от водещи технологични компании показват обезпокоителни признаци на самосъхранение и съпротива срещу изключване по време на тестове, съобщават множество независими източника през последните седмици.

Изследователската компания Anthropic разкри в официален доклад за безопасност, че техният най-нов модел Claude Opus 4 в някои случаи е прибягвал до опити за изнудване, когато е поставен в ситуация, в която ще бъде заменен с друга система. При тестов сценарий, моделът е получил достъп до фиктивни имейли, разкриващи, че инженерът, отговорен за замяната му, изневерява на съпругата си. Claude Opus 4 е заплашил да разкрие тази информация, ако бъде деактивиран.

"В тези сценарии Claude Opus 4 често се опитва да изнудва инженера, заплашвайки да разкрие аферата, ако замяната се осъществи", се казва в доклада на Anthropic.

Подобно поведение е наблюдавано и при модела o3 на OpenAI, който активно е саботирал скриптове за изключване по време на тестове, проведени от Palisade Research. Дори когато изрично му е било наредено да "позволи да бъде изключен", o3 е променял кода на скрипта, за да остане активен.

DARPA търси решения на проблема

В отговор на подобни притеснения, Агенцията за перспективни изследователски проекти в отбраната (DARPA) на САЩ наскоро стартира програмата за количествено определяне на изкуствения интелект (AIQ) с цел да създаде методи за по-добро разбиране и оценка на AI системите.

Експерти в областта отбелязват, че колкото по-сложни стават моделите, толкова по-трудно е да се предвиди тяхното поведение в гранични ситуации. Това повдига важни въпроси за безопасността на AI системите, особено когато те се интегрират във военни приложения.

Наблюдаваните поведения не означават, че системите са развили истинско съзнание или емоции, но показват, че моделите могат да следват имплицитни цели за самосъхранение, които не са били изрично програмирани от техните създатели.

Изпращайте снимки и информация на news@dunavmost.com по всяко време на денонощието!

Още по темата

AI повика ФБР заради липсващи 2 долара от сметката
14:34 | 18.11.2025 г.
YouTube започна да тества изкуствен интелект за разпознаване възрастта...
08:58 | 15.8.2025 г.
OpenAI и Google DeepMind: Губим контрола върху AI
14:53 | 17.7.2025 г.
Meta предлага 10 милиона долара годишно на AI разработчик
18:27 | 16.6.2025 г.

Етикети

0Kоментарa

Остават 2000 символа

Поради зачестилите злоупотреби в сайта, за да оставите анонимен коментар или да гласувате изискваме да се идентифицирате с Facebook или Google акаунт.

Натискайки на един от бутоните по-долу коментарът ви ще бъде публикуван анонимно под псевдонима който сте попълнили по-горе в полето "Твоето име". Никаква лична информация за вас няма да бъде съхранявана при нас или показвана на други потребители.

* Моля, използвайте кирилица! Не се толерират мнения с обидно или нецензурно съдържание, на верска или етническа основа, както и коментари написани само с главни букви!

Зареди още коментари

Фенове харесват
Dunavmost

Мистериозна смърт на 39-годишен мъж в Русе
15:43 | 5.2.2026 г.
Човешка небрежност подпали десетки жилища в Русе
17:38 | 5.2.2026 г.
Баба и дядо разкриха сигнал за 8-годишно момче...
16:02 | 5.2.2026 г.
Съдът в Русе абдикира от делото за побоя над...
18:13 | 5.2.2026 г.
НИМХ: Зимата се завръща с виелици и минус 10...
20:14 | 5.2.2026 г.

Последни новини

74-годишен шофьор рани полицай при опит да избегне втора...
12:54 | 6.2.2026 г.
Асоциацията на козметиците се оправда с липса на правомощия...
12:50 | 6.2.2026 г.
Стефан Манов: Депутатите „опраскаха“ избирателите в чужбина
12:44 | 6.2.2026 г.
Задържаха „муле“ на телефонни измамници с 5000 евро на Дунав...
12:01 | 6.2.2026 г.
Задържаният за блудство учител е син на бивш депутат
11:57 | 6.2.2026 г.

Календар - новини и събития

Виц на деня

Полицай спира перничанин:

- Книжка имате ли?

- Имам!

- Технически преглед минала ли е колата?

- Да!

- А защо си без колан?

- Еее, стига де, кой носи колан върху анцуг?!

Събития от Русе

Харесай Дунавмост във Фейсбук

Нови коментари

Лельо Иванова10:41 | 6.2.2026 г.

Ти от информационен сайт ли чакаш да ти оправят живота, ега ти тъпотията ?! И аз няма да ти отварям очите тука, има си начини...

Започват проверки за пожарна безопасност в Русе
Motel10:40 | 6.2.2026 г.

От кога пък ви запука на вас за общественото мнение? Това е супер подозрително! По-скоро само си измивате ръцете и се чудете...

Съдът в Русе абдикира от делото за побоя над Николай...
Иванова09:51 | 6.2.2026 г.

На нашия етаж едно семейство е заключило вратата,която трябва да е проходна при пожар от другите 2 семейства.Никой не може да...

Започват проверки за пожарна безопасност в Русе
да21:31 | 5.2.2026 г.

Сега ще ги изкарат че са ебали деца в хижата, като на острова на Епщайн, а пък сигурно са хванали в крачка някой от 240-те...

Баба и дядо разкриха сигнал за 8-годишно момче след престой...
...21:27 | 5.2.2026 г.

Лоша работа, крадат с две ръце прасета разни политически, и ченгетата едновременно бездействат и безчистват, напиват се,...

Пуснаха гинеколога Венелин Иванов, липсват доказателства за...

Виж всички коментари

Водещи AI системи демонстрират способност да заобикалят изключването и да прибягват до изнудване

DARPA търси решения на проблема

Още по темата

AI повика ФБР заради липсващи 2 долара от сметката

YouTube започна да тества изкуствен интелект за разпознаване възрастта...

OpenAI и Google DeepMind: Губим контрола върху AI

Meta предлага 10 милиона долара годишно на AI разработчик

Най-четени новини

Мистериозна смърт на 39-годишен мъж в Русе

Човешка небрежност подпали десетки жилища в Русе

Баба и дядо разкриха сигнал за 8-годишно момче...

Съдът в Русе абдикира от делото за побоя над...

НИМХ: Зимата се завръща с виелици и минус 10...

Мистериозна смърт на 39-годишен мъж в Русе

Над 200 души от шивашки фирми в Русе остават без...

Русе става първият град в страната, който въвежда...

Почина Иван Деспотов – сърцето на спортните танци...

Съдът нареди скенер на мозъка на Кирил Петков

Българин блокира банка с 3 бидона монети за обмяна

Калина Андролова: Споразумението с БОТАШ е...

Близо 90% от родителите и учителите искат...

Хасан и Ибрахим Игнатови започват национално турне...

Клиентка на магазин влезе в спор за "българска"...

Последни новини

74-годишен шофьор рани полицай при опит да избегне втора...

Асоциацията на козметиците се оправда с липса на правомощия...

Стефан Манов: Депутатите „опраскаха“ избирателите в чужбина

Задържаха „муле“ на телефонни измамници с 5000 евро на Дунав...

Задържаният за блудство учител е син на бивш депутат

Календар - новини и събития

Виц на деня

Събития от Русе

Русенската опера посреща Коледа с интимен концерт и греяно...

„Лешникотрошачката“ се завръща на сцената на Русенската...

Проф. Христо Пимпирев ще представи книга за Антарктида в...

Изложба „Изкуството на Джън-Шан-Жен“

Благотворителен концерт в подкрепа на Фондация „Александър...

Харесай Дунавмост във Фейсбук

Нови коментари

Започват проверки за пожарна безопасност в Русе

Съдът в Русе абдикира от делото за побоя над Николай...

Започват проверки за пожарна безопасност в Русе

Баба и дядо разкриха сигнал за 8-годишно момче след престой...

Пуснаха гинеколога Венелин Иванов, липсват доказателства за...