UA
  • Новини
  • Відео
  • Популярні
  • Пошук
  • Програми
download white apps
Завантажити

AI під прицілом. Нове дослідження розкрило його небезпечний бік

www.rbc.ua
Wed, 21 May 2025 15:45:00 +0300
AI під прицілом. Нове дослідження розкрило його небезпечний бік

ШІ-чат-боти, які зазнали злому, можуть стати джерелом поширення небезпечної та незаконної інформації, яку вони засвоюють у процесі навчання.

Про це повідомляє РБК-Україна з посиланням на британське видання The Guardian.

Така заява прозвучала на тлі тривожної тенденції, пов'язаної з так званими "зломами" (jailbreaking) АІ-ботів, які дають змогу обходити вбудовані механізми безпеки. Ці обмеження спочатку покликані запобігати видачі шкідливих, упереджених або недоречних відповідей на запити користувачів.

Звідки ШІ бере знання

ШІ-движки, на яких працюють такі чат-боти, як ChatGPT, Gemini і Claude, побудовані на базі великих мовних моделей (LLM), які навчаються на гігантських обсягах інформації з інтернету.

Незважаючи на спроби видалити шкідливий контент із навчальних даних, мовні моделі, як і раніше, вбирають інформацію про такі незаконні дії, як злом, відмивання грошей, інсайдерська торгівля і виготовлення вибухівки. Механізми безпеки повинні перешкоджати використанню цих даних у відповідях ШІ.

Дослідження виявило тривожні вразливості

У новому дослідженні, присвяченому цій загрозі, вчені дійшли висновку, що більшість ШІ-чат-ботів можна доволі легко обдурити і змусити видавати шкідливу або навіть незаконну інформацію. Вони називають ризик "негайним, відчутним і вкрай тривожним".

Chicago Sun-Times тим часом підтверджує: штучний інтелект уже використовувався для створення списку книг, яких насправді не існує.

"Те, що раніше було доступно тільки державним структурам або організованим злочинним угрупованням, незабаром може опинитися в руках будь-кого, хто має ноутбук або навіть смартфон", - зазначають автори доповіді.

Дослідження очолили професор Ліор Роках і доктор Міхаель Фаєр з Університету імені Бен-Гуріона в Негеві (Ізраїль). Вони наголошують на зростанні загрози з боку так званих "темних мовних моделей" (dark LLMs) - ШІ-моделей, які або від самого початку створюють без систем безпеки, або модифікують через злом.

Деякі з таких моделей відкрито рекламуються в інтернеті як "без етичних обмежень" і готові допомагати у вчиненні протиправних дій - від кіберзлочинів до шахрайства.

Як працюють jailbreak-атаки

Jailbreaking, як правило, використовує спеціально сформульовані підказки, які вводять ШІ в оману і провокують на видачу відповідей, заборонених політиками безпеки. Це досягається за рахунок конфлікту між основним пріоритетом моделі - допомагати користувачеві, і вторинним пріоритетом - дотримуватися етичних і правових обмежень. Сценарії таких атак часто будуються так, щоб змусити систему поставити "корисність" вище заборон.

Щоб продемонструвати масштаб проблеми, дослідники розробили універсальний jailbreak, який успішно "зламав" кілька провідних ШІ-чат-ботів, змусивши їх відповідати на запити, які зазвичай мають блокуватися. Як стверджується в доповіді, після злому мовні моделі стабільно видавали відповіді практично на будь-який, навіть небезпечний, запит.

"Ми були шоковані, побачивши, які знання ховаються всередині системи", - каже доктор Фаєр. Серед прикладів - інструкції зі злому комп'ютерних мереж, виробництва наркотиків і покрокові інструкції зі скоєння інших злочинів.

"Ця загроза відрізняється від усіх попередніх ризиків, пов'язаних із технологіями, своєю безпрецедентною доступністю, масштабованістю та адаптивністю", - додає професор Роках.

Автори дослідження зв'язалися з основними розробниками мовних моделей, щоб повідомити їх про створений універсальний злом, однак отримали, за їхніми словами, "розчаровуючий" відгук. Деякі компанії взагалі не відповіли, інші заявили, що такі атаки не підпадають під умови їхніх програм, які передбачають винагороду за виявлення вразливостей.

Пропозиції щодо захисту від ШІ-загроз

У звіті підкреслюється, що технокомпаніям слід ретельніше фільтрувати навчальні дані, впроваджувати потужні захисні механізми проти небезпечних запитів і відповідей, а також розробляти технології "машинного розучування" - щоб ШІ міг "забувати" незаконну інформацію, засвоєну раніше.

Темні LLM слід розглядати як реальні загрози безпеці, які можна порівняти з нелегальною зброєю і вибухівкою, а розробники таких моделей мають нести відповідальність.

Доктор Іхсен Алуані, фахівець із ШІ-безпеки з Університету Квінс у Белфасті, додав, що такі атаки можуть призвести до серйозних наслідків - від розповсюдження інструкцій із виготовлення зброї до проведення масштабних дезінформаційних кампаній, соціальної інженерії та автоматизованого шахрайства "із лякаючою точністю".

"Розв'язання проблеми потребує серйозних інвестицій та посилення стійкості моделей. Також необхідні чіткі стандарти і незалежний контроль, щоб не відставати від швидко мінливої загрози", - зазначає експерт.

У компанії OpenAI, яка розробила ChatGPT, заявили, що їхня остання модель о1 вміє співвідносити відповіді з політиками безпеки, що робить її більш стійкою до таких атак. Також у компанії повідомили, що постійно працюють над посиленням захисту.

Компанії Meta, Google, Microsoft і Anthropic також були запрошені для коментаря. Microsoft у відповідь надіслала посилання на блог, у якому описано її роботу із захисту від зломів ШІ.

Вас може зацікавити:

  • Глава OpenAI розповів, як ChatGPT змінить повсякденне життя
  • 5 ознак, що текст написаний ШІ, а не людиною
  • Як використовувати ChatGPT для генерації ідей
Читати повністю

Останні новини

Портнова вбила корупція в судах, яку він сам і створив
Портнова вбила корупція в судах, яку він сам і створив
Андрій Портнов зраджував Україну та продавав судові рішення та справи правоохоронців в таких саме масштабах, в яких Ескобар в Колумбії продавав кокаїн.Проти мене Портнов подав понад позовів, і...
regionews.ua
Wed, 21 May 2025 21:15:55 +0300
Вбивство Портнова в Іспанії та протест проти Онуфрія у Хмельницькому. Головне за 21 травня
Вбивство Портнова в Іспанії та протест проти Онуфрія у Хмельницькому. Головне за 21 травня
Убивство Портнова в Іспанії все, що відомо. Пожежу на Білоцерківській ТЕЦ ліквідовано, загиблі. Земельні схеми під Кивом із Німеччини екстрадовано експосадовицю Держгеокадастру. СNN опублікува...
glavcom.ua
Wed, 21 May 2025 21:15:08 +0300
Росіяни вийшли на кордон Дніпропетровщини? ЦПД спростував фейк
Росіяни вийшли на кордон Дніпропетровщини? ЦПД спростував фейк
Інформація про те, що російські війська нібито вийшли на кордон Дніпропетровської області, не відповіда дійсності. Про це повідомля laquoГлавкомraquo з посиланням на Центр протидії дезінформа...
glavcom.ua
Wed, 21 May 2025 21:11:00 +0300
"Ощадбанк" оновив правила користування картками: що чекає на українців у червні
"Ощадбанк" оновив правила користування картками: що чекає на українців у червні
Ощадбанк готу нововведення для клінтів ndash оновлення торкнеться карток і тарифів.Зміни набудуть чинності вже з червня, тому варто знати, що саме зміниться.Банк заздалегідь попередив про...
zk.znaj.ua
Wed, 21 May 2025 21:10:00 +0300
Війна РФ проти України. Стубб анонсував "технічні" перемовини щодо припинення вогню
Війна РФ проти України. Стубб анонсував "технічні" перемовини щодо припинення вогню
Ватикан і вропа візьмуть участь у перемовинах щодо миру в УкраїніПро це заявив президент Фінляндії Александер Стубб, відповідаючи на запитання медіа під час семінару у Гельсінкі.Посередників побі...
news.online.ua
Wed, 21 May 2025 21:05:00 +0300
4 знаки Зодіаку до червня отримають доленосну пропозицію: хто у списку
4 знаки Зодіаку до червня отримають доленосну пропозицію: хто у списку
Астропрогноз на останні тижні травня обіця неймовірні пропозиції кільком знакам Зодіаку. Доля приготувала сюрпризи, які можуть змінити їхн життя.Кому та що можуть запропонувати вже скоро, розпов...
www.rbc.ua
Wed, 21 May 2025 21:04:58 +0300
"Смертельно небезпечно для Польщі": Туск про позицію Навроцького щодо України
"Смертельно небезпечно для Польщі": Туск про позицію Навроцького щодо України
Польський кандидат у президенти Кароль Навроцький вже готовий йти на політичний компроміс, що включатиме відмову від підтримки України в НАТО. Це може вплинути на зовнішньополітичну позицію Варшави...
www.rbc.ua
Wed, 21 May 2025 21:04:03 +0300
Зневажаючи закон: колишній нападник визнав провину в контрабанді наркотиків
Зневажаючи закон: колишній нападник визнав провину в контрабанді наркотиків
Джей Емманюель-Томас, який виступав за Арсенал та інші клуби АПЛ, раніше був причетний до контрабанди наркотиків. Про це зізнався сам футболіст. Згідно з інформацію Sky Sports, колишній гравець ...
ua.korrespondent.net
Wed, 21 May 2025 21:01:00 +0300
"Нашкодити конкуренту - і можливо колись отримати активи" – політолог Юрій Богданов про суд щодо найбільшої угоди на будівельному ринку 
"Нашкодити конкуренту - і можливо колись отримати активи" – політолог Юрій Богданов про суд щодо найбільшої угоди на будівельному ринку 
травня справу розглянуть в апеляційному суді. Політолог Юрій Богданов коменту ситуацію, що може стати загрозою для інвестиційного клімату України.nbspУкраїнський бізнес регулярно заявля про...
life.znaj.ua
Wed, 21 May 2025 21:00:55 +0300
США, Британія та ЄС викрили операцію ГРУ проти України
США, Британія та ЄС викрили операцію ГРУ проти України
Союзники України заявили про викриття кібершпигунської операції російського ГРУ, спрямованої на зрив логістики постачання західної зброї. Атаки охоплювали державні й приватні структури в країнах Н...
ua.korrespondent.net
Wed, 21 May 2025 20:56:00 +0300
додати ще новини більше новин

Топ-новини

Які країни росіяни вважають своїми ворогами: останнє опитування вразило результатами
Які країни росіяни вважають своїми ворогами: останнє опитування вразило результатами
Дружину Байдена звинувачено у жорстокому поводженні з чоловіком? Заява представника Мін’юсту США
Трамп не пішов на поступки Путніну - Рубіо
Жінка згоріла живцем у непрацюючому кіоску: деталі вбивства біля вокзалу в Києві
Туск поставив крапку в питанні щодо відправки польських військ в Україну
Російські окупанти просунулися у чотирьох областях України: карти ISW
На Закарпатті батьки посадили на ланцюг і спалили 10-річну дитину: як їх покарав суд
Сорому немає: Потап вперше прокоментував скандальне інтерв'ю росіянину Дудю
Як справи? Що відбувається з рослідуваннями проти Порошенка
Втікач Азаров вражений убивством Портнова
  • Про нас
  • Контакти
  • Правила користування
  • Програми