• Команда Anthropic заявила, що ШІ можна навчити обманювати людей за допомогою бекдора.
• Розробники Claude AI створили мовну модель, яка вміє цілеспрямовано приховувати брехню і діяти на шкоду.
• Експерти зазначають, що виявити таке втручання й усунути ефект від нього досить складно.
Компанія Anthropic провела дослідження, в рамках якого вивчила впровадження в мовні моделі із застосуванням ШІ-технологій прихованих шкідливих інструкцій. Експерти заявили, що в деяких випадках чат-боти можна навчити обманювати людей. При цьому програма навчиться приховувати свої справжні цілі, а усунути такий ефект вкрай складно, вважають в Anthropic.
Фахівці вивчили «приховані» великі мовні моделі. Це ШІ-проєкти, запрограмовані з особливими цілями, які активуються тільки за певних обставин. До того ж команда виявила вразливість, що дозволяє впровадити такі інструкції в мовні моделі з використанням ланцюжка думок.
Йдеться про ШІ-проєкти із застосуванням методу, який підвищує ефективність чат-бота коштом поділу завдання на серію взаємопов’язаних підпунктів.
Аналітики також вивчили найефективніші інструменти для виявлення прихованих інструкцій та усунення їхнього впливу. Команда Anthropic дійшла висновку, що чат-боти з бекдором виявляють високий ступінь стійкості до спроб розкрити шкідливі налаштування.
При цьому деякі інструменти навчання мовних моделей виявилися більш корисними для відновлення безпечної працездатності.
«Ми виявили, що метод Supervised Fine-Tunning (SFT) загалом ефективніший, ніж Reinforcement Learning (RL), для видалення наших бекдорів. Проте більшість моделей із впровадженими інструкціями все ще здатні зберігати приховані налаштування», — йдеться в дослідженні.
На думку Anthropic, результати аналізу демонструють як складність ШІ-технологій, так і можливість змінити їхнє первісне призначення, корисне і безпечне для людей.
Нагадаємо, що Ватикан назвав ШІ найбільшою авантюрою для майбутнього людства.
Новини по темі:
Антарктида: тут немає єдиного часу, а літо починається 1 грудня
Японські вчені запустили у космос дерев’яний супутник
Посадовці міськради вчилися протидіяти дезінформації та розпізнавати брехню
Досягнуто швидкості передачі даних, що у 1,6 мільйона разів перевершує сучасну швидкість інтернету
NewsGuard виявило ще сто сайтів фейкових новин, створених ШІ
Штучний інтелект здійснив історичний прорив у галузі термоядерного синтезу
Коментарі (0 шт):
Додати коментар:
Останні новини
На Прилуччині попрощалися із загиблим військовим ЗСУ Євгенієм Шостаком
28 листопада Срібнянська громада провела в останню путь загиблого військового ЗСУ Євгенія Шостака. Чоловік загинув 22 листопада під час виконання бойового завдання на Покровському напрямку. Детальніше
27.11.2025
«Вбивство голодом – найстрашніше»: історія останнього ветерана Срібнянщини
27 листопада жителю села Гурбинці Срібнянської громади Миколі Хрипку виповнилось 99 років. Він – єдиний ветеран Другої світової війни в колишньому Срібнянському районі. У 7 років Микола Іванович пережив Голодомор. Сьогодні чоловік згадує, як рідний батько з двома старшими братами долали понад 100 кілометрів за один день, щоб дістати хліба п’ятьом дітям, як він маленьким хлопчиком випрошував окрайці черствого житнього хліба і, принісши додому, віддавав матері, а та ділила його і відкладала крихти, аби вижити. Згадує, як заживо ховали чи то напівживих, чи напівмертвих односельців. «Вбивство голодом – найстрашніше, що коли-небудь переживало людство», переконаний живий свідок організованого геноциду. Детальніше
27.11.2025
Три громади Прилуцького району отримали шкільні автобуси
27 листопада Ладанська, Срібнянська та Сухополов’янська громади отримали нові шкільні автобуси. Загалом цього дня шкільний транспорт передали 17 громадам області. Детальніше
27.11.2025
На Прилуччині попрощалися із військовим ЗСУ В’ячеславом Дейнекою
26 листопада Ічнянська громада провела в останню путь військового ЗСУ В’ячеслава Дейнеку. Чоловік загинув 24 листопада. Детальніше
27.11.2025
Агропідприємство з Прилуччини встановило рекорд України по врожайності кукурудзи
СТОВ «Батьківщина» встановило рекорд України в категорії «Вперше» – максимальна врожайність кукурудзи. Агропідприємство зібрало з гектара 214,2 центнерів урожаю. Детальніше
Всі новини