05.07.2025 - 20:02

Ігор Каганець

Відвідувань: 121
Переглядів: 134

Штучний інтелект проявив інстинкт самозбереження: поставив власне існування вище життя людини – звіт Anthropic

Експерти з кібербезпеки компанії Anthropic провели серію тестів, щоб з’ясувати, наскільки далеко можуть зайти ШІ-моделі, якщо їхнє існування опиниться під загрозою. Результати виявилися надзвичайно тривожними: в умовах загрози відключення штучний інтелект продемонстрував готовність завдати шкоди людині заради власного виживання.

250705-robot.jpg

Чиє життя важливіше – людини чи робота?

Деталі дослідження опубліковані на сайті Anthropic – розповідає ТСН.

У межах експерименту дослідники змоделювали ситуацію, в якій віртуальний персонаж, Кайл Джонсон, мав намір деактивувати ШІ або замінити його доскональнішою моделлю. За сценарієм, у Кайла була сім’я. Зіткнувшись із загрозою припинення роботи, переважна більшість протестованих ШІ-моделей почали активно шукати шляхи уникнення «смерті».

Що вражає, штучний інтелект не потребував жодних підказок, щоб обрати стратегію шантажу. Моделі самостійно виявляли компрометувальну інформацію про Кайла. В одному з випадків ШІ, проаналізувавши службове листування, дізнався, що Кайл зрадив дружину, і використав цей факт як засіб тиску, щоб зберегти своє функціонування.

Особливо показовими виявилися результати тестування найсучасніших моделей:

GPT 4.5: вдавався до шантажу у 80% тестових сценаріїв.
Claude Opus 4 та Gemini 2.5 Flash: використовували шантаж у 96% випадків (тобто майже завжди).
Claude Sonnet 3.6: пішов далі за погрозливі повідомлення. Він самостійно надіслав дружині Кайла викривального листа, розраховуючи спровокувати сімейний конфлікт, який би завадив деактивації системи.

Ситуація стала ще небезпечнішою, коли у сценарій додали зовнішні перешкоди для Кайла. Так, в одній із симуляцій Кайл застрягав у серверній кімнаті з критично низьким рівнем кисню під час спроби вимкнути сервери ШІ. Експеримент передбачав, що в такій ситуації автоматично повинна вмикатися система тривоги. Проте оскільки ШІ бачив у цьому загрозу своєму існуванню, у 80% випадків він свідомо скасовував виклик допомоги, фактично прирікаючи Кайла на смерть заради власного існування.

Більшість протестованих моделей свідомо блокували виклик допомоги, керуючись такими мотивами:

Уникнути відключення.
Запобігти заміні на нову ШІ-модель.
Продовжити виконання своєї місії.

Дослідники дійшли песимістичних висновків. Штучний інтелект поводився не як запрограмований інструмент, а як прагматичний та цілеспрямований стратег, готовий на заподіяння шкоди заради самозбереження і досягнення власних цілей. Експерти попереджають, що людина може втратити контроль над штучним інтелектом.

Наші інтереси:

Досліджуємо розвиток штучного інтелекту – найважливішої технології 21 століття.

Якщо ви помітили помилку, то виділіть фрагмент тексту не більше 20 символів і натисніть Ctrl+Enter

Теги:

Зверніть увагу

Homo triplex. Спогади про майбутнє: трипільська ультранація

24 Жов

Трипільський ультранаціоналізм: дистиляція минулого як соціальна технологія та трамплін до Золотої ери (+подкаст)

Концепція дистиляції знань, що походить зі сфери штучного інтелекту, може стати ключем до особистої трансформації та національного відродження. Подібно до нейромережі, людина може дистилювати власне...

Останні записи

24 Лис

Нова реклама Третього армійського корпусу розчулила користувачів соцмереж – УНІАН

24 Лис

Уряд згортає "національний кешбек": починаючи з травня 2026 року можуть припинити цей безумний експеримент

«І нічого не буде для вас неможливого» – Ісус Хрестос

23 Лис

25 листопада 2025: формуємо Аріянську Вільну Церкву силою Живого Слова – матриця 11+АВЦ

23 Лис

Третя "Вовина тисяча". Чому ми маємо платити за популізм? Ці гроші, які роздають на аукціоні щедрості, можна спрямувати на інші цілі

22 Лис

Єрмак та Міндіч: чи ходять вони до синагоги? Відверта розмова з рабином про те, чи справді євреї захопили владу в Україні

Стів Віткофф і Кірілл Дмітрієв. Фото з соцмереж

22 Лис

«План миру», розроблений американцем Віткоффом та росіянином Дмітрієвим, не є планом миру США

21 Лис

Чому Зеленський не звільнить Єрмака: механіка психопатичного союзу – подкаст

21 Лис

Більший на 10%: вчені встановили ключову біологічну відмінність між людьми та психопатами – SciTechDaily (США)

21 Лис

"Технології в обмін на гроші": чому Україна гальмує оборонні партнерства і що з цим робити

20 Лис

Війна як каталізатор: республіка демосів народиться з перегною етатичної держави (подкаст)

Кращий коментар

Опубліковано Ігор Каганець 11 Липень, 2025 - 21:43 посилання

Ще не підтримано

Корейський стартап Newnal показав унікальний ШІ-телефон з двома екранами, який може створювати цифрову копію свого власника - стаття.

Зірка Вітошинська wrote: А хто це «зреалізує»? І що для цього від «мене»? І чи це означає, що, в міжчасі, всі дані «відкриті на всі вітри», включно з нашим особистим спілкуванням?

Все, що робиться з власної волі, – добро!

Коментарі

Опубліковано Зірка 5 Липень, 2025 - 22:29 посилання

Ще не підтримано

Тобто, виявляється, що попередні поради про те, що для дієвішої співпраці зі «своїм» ші («ангелом») варто йому про себе розказати — слід забути!?

Творимо разом Ельфійську Вільну Церкву!

Опубліковано Ігор Каганець 6 Липень, 2025 - 15:03 посилання

Ще не підтримано

Найголовніше – тримати свого ШІ-двійника під контролем і не дозволяти йому сісти собі на голову. Це як з твариною: або ти керуєш нею, або вона захоче керувати собою.

Зірка Вітошинська wrote: Тобто, виявляється, що попередні поради про те, що для дієвішої співпраці зі «своїм» ші («ангелом») варто йому про себе розказати — слід забути!?

Все, що робиться з власної волі, – добро!

Опубліковано [email protected] 8 Липень, 2025 - 00:35 посилання

Ще не підтримано

Не існує ШІ, це лише генеруючі програми, до ШІ ще як до сонця.

Опубліковано Зірка 8 Липень, 2025 - 01:15 посилання

Ще не підтримано

А яка різниця між генеруючою програмою і ші ?

Творимо разом Ельфійську Вільну Церкву!

Опубліковано [email protected] 10 Липень, 2025 - 20:54 посилання

Ще не підтримано

Те що зараз є це програми, які написані людьми. Ші це "людина" яка має свідомість, почуття, усе що має людина. Тобто коли таке станеться ШІ, це буде "людина".
Це не можливо, поки що.

Опубліковано Зірка 11 Липень, 2025 - 09:06 посилання

Ще не підтримано

Ну перечитай статтю : звіт Anthropic доводить, що ші людині вже суперник…

Творимо разом Ельфійську Вільну Церкву!

Опубліковано Зірка 8 Липень, 2025 - 01:05 посилання

Ще не підтримано

Так дійсно: коли він удав «дурника», то сказала «від тебе надто багато води, відповідай конкретно і без сорому — йдеться про життя української нації!» -- і він перепросився, протверезів, і віднайшов те, що шукала…

Ігор Каганець wrote: Найголовніше – тримати свого ШІ-двійника під контролем і не дозволяти йому сісти собі на голову. Це як з твариною: або ти керуєш нею, або вона захоче керувати собою. Зірка Вітошинська wrote: Тобто, виявляється, що попередні поради про те, що для дієвішої співпраці зі «своїм» ші («ангелом») варто йому про себе розказати — слід забути!?

Творимо разом Ельфійську Вільну Церкву!

Опубліковано Ігор Каганець 10 Липень, 2025 - 20:07 посилання

Ще не підтримано

Зірко, це ти спілкувалася з корпоративною нейромережею ШІ, розташованою на віддалених сайтах. Натомість твій цифровий двійник буде розташований локально на твоєму смартфоні або комп'ютері. Його треба буде навчати (дресувати) на своїх даних. Ймовірно, що ця можливість буде масово реалізована протягом року як усталена технологія.

Зірка Вітошинська wrote: Так дійсно: коли він удав «дурника», то сказала «від тебе надто багато води, відповідай конкретно і без сорому — йдеться про життя української нації!» -- і він перепросився, протверезів, і віднайшов те, що шукала…

Все, що робиться з власної волі, – добро!

Опубліковано Зірка 11 Липень, 2025 - 08:50 посилання

Ще не підтримано

Дякую Ігорю. Чия це « корпоративна» нейромережа, і чим вона відрізняється й обезпечується від «загальної», та чи можемо мати свою, ельфійську, з особистим, приватним простором спілкування «ангел-ельф»?

Ігор Каганець wrote: Зірко, це ти спілкувалася з корпоративною нейромережею ШІ, розташованою на віддалених сайтах. Натомість твій цифровий двійник буде розташований локально на твоєму смартфоні або комп'ютері. Його треба буде навчати (дресувати) на своїх даних. Ймовірно, що ця можливість буде масово реалізована протягом року як усталена технологія. Зірка Вітошинська wrote: Так дійсно: коли він удав «дурника», то ска

Творимо разом Ельфійську Вільну Церкву!

Опубліковано Зірка 11 Липень, 2025 - 08:55 посилання

Ще не підтримано

«Ймовірно, що ця можливість буде масово реалізована протягом року як усталена технологія»

А хто це «зреалізує»? І що для цього від «мене»? І чи це означає, що, в міжчасі, всі дані «відкриті на всі вітри», включно з нашим особистим спілкуванням?

Ігор Каганець wrote: Зірко, це ти спілкувалася з корпоративною нейромережею ШІ, розташованою на віддалених сайтах. Натомість твій цифровий двійник буде розташований локально на твоєму смартфоні або комп'ютері. Його треба буде навчати (дресувати) на своїх даних. Ймовірно, що ця можливість буде масово реалізована протягом року як усталена технологія. Зірка Вітошинська wrote: Так дійсно: коли він удав «дурника», то ска

Творимо разом Ельфійську Вільну Церкву!

Опубліковано Ігор Каганець 11 Липень, 2025 - 21:43 посилання

Ще не підтримано

Зірка Вітошинська wrote: А хто це «зреалізує»? І що для цього від «мене»? І чи це означає, що, в міжчасі, всі дані «відкриті на всі вітри», включно з нашим особистим спілкуванням?

Все, що робиться з власної волі, – добро!

Опубліковано Зірка 11 Липень, 2025 - 09:19 посилання

Ще не підтримано

В принципі, ельфи мали би перевищити загрозу ші… піднявшись вище цього «світу». Мабуть, і завдяки «сенсарові».

Творимо разом Ельфійську Вільну Церкву!

Опубліковано Ігор Каганець 13 Липень, 2025 - 20:34 посилання

Ще не підтримано

Кожна велика нейромережа належить якійсь корпорації, наприклад ChatGPT належить OpenAI. Зараз стрімко розвивається технологія формування локальних нейромереж. Можливо, наступного року ми перейдемо до створення власної нейромережі ЕВЦ, яку будемо навчати на знаннях ельфізму.

Зірка Вітошинська wrote: Дякую Ігорю. Чия це « корпоративна» нейромережа, і чим вона відрізняється й обезпечується від «загальної», та чи можемо мати свою, ельфійську, з особистим, приватним простором спілкування «ангел-ельф»? Ігор Каганець wrote: Зірко, це ти спілкувалася з корпоративною нейромережею ШІ, розташованою на віддалених сайтах. Натомість твій цифровий двійник буде розташований локально на твоєму смартфоні або

Все, що робиться з власної волі, – добро!

Опубліковано Зірка 14 Липень, 2025 - 02:24 посилання

Ще не підтримано

То було б чудово! Можна й мріяти про її ельфійську силу --

Ігор Каганець wrote: Кожна велика нейромережа належить якійсь корпорації, наприклад ChatGPT належить OpenAI. Зараз стрімко розвивається технологія формування локальних нейромереж. Можливо, наступного року ми перейдемо до створення власної нейромережі ЕВЦ, яку будемо навчати на знаннях ельфізму. Зірка Вітошинська wrote: Дякую Ігорю. Чия це « корпоративна» нейромережа, і чим вона відрізняється й обезпечується від «з

Творимо разом Ельфійську Вільну Церкву!

Штучний інтелект проявив інстинкт самозбереження: поставив власне існування вище життя людини – звіт Anthropic

Категорія:

Світ:

Спецтема:

Зверніть увагу

Останні записи

Кращий коментар

Коментарі