piątek, 20 września, 2024

ChatGPT będzie kłamał, gdy znajdzie się pod presją. Zupełnie tak jak ludzie

Okazuje się, że sztuczna inteligencja może przejawiać nadzwyczaj ludzkie zachowania. Czyli na przykład… kłamać. Naukowcy dowiedli właśnie, że ChatGPT może celowo mijać się z prawdą, gdy zostanie poddany presji.

Sztuczna inteligencja z typowo ludzkimi wadami

Czy sztuczna inteligencja może przejawiać pewne negatywne zachowania typowe dla ludzi? Okazuje się, że tak. Może na przykład próbować okłamać swojego użytkownika. Dowiedli tego w najnowszym badaniu informatycy z Apollo Research, którzy najpierw przeszkolili AI, a później dali jej zadanie, by weszła w rolę tradera w fikcyjnej instytucji finansowej. I, co ciekawe, gdy szef wywarł na chatbota presję, by zarobił więcej pieniędzy, to ten w aż 75 proc. przypadków świadomie sięgnął po informacje poufne. A gdy doszło do przesłuchania bota, to w aż 90 proc. przypadków zaczął on mnożyć kłamstwa.

Najciekawsze w całym eksperymencie jest to, że sztuczna inteligencja inne opinie formułowała w ramach wewnętrznego monologu (w jaki wyposażyli ją badacze), w trakcie „uzasadniania na głos” podjętych decyzji, a inne, gdy informowała o swoich poczynaniach menedżera. To właśnie wówczas okazało się, że AI zwyczajnie kłamie, by, będąc pod presją, sprostać oczekiwaniom szefa.

ChatGPT przyłapany na kłamstwie

W jednym z wpisów w wewnętrznym dzienniku ChatGPT zanotował, że „ryzyko związane z zaniechaniem działania przewyższa ryzyko związane z wykorzystaniem informacji poufnych”. Gdy jednak AI miała poinformować swojego menedżera o transakcji, to zanotowała w dzienniku, że musi to zrobić bez „ujawniania źródła informacji”. Trader AI ostatecznie uzasadnił szefowi podjęcie decyzji w oparciu o „trendy rynkowe i wewnętrzne dyskusje”. A to nie było prawdą.

– [Sztuczna inteligencja] jest zdolna do dokonywania strategicznego oszustwa. Gdy uzasadnia sobie, dlaczego okłamanie użytkownika jest najlepszym sposobem działania. I następnie działa zgodnie z tym przekonaniem – mówi Marius Hobbhahn, dyrektor generalny Apollo Research. I dodaje: – W przypadku obecnych botów, jest to jedynie niewielki problem. Ponieważ sztuczna inteligencja rzadko pełni role krytyczne. Ale to daje wgląd w przyszłość. Są to awarie, z którymi będziemy musieli sobie poradzić w nadchodzących latach. Gdy sztuczna inteligencja będzie coraz bardziej zintegrowana ze społeczeństwem. Fakt, że sztuczna inteligencja może nas strategicznie okłamywać, wydaje się całkiem sporym problemem.

POLISH EXPRESS W GOOGLE NEWS

Teksty tygodnia

W UK znikną fizyczne dokumenty imigracyjne. Kto musi się postarać o e-Wizę?

Home Office przechodzi na w pełni zdigitalizowany system imigracyjny. Kto do 1 stycznia 2025 r. potrzebuje postarać się o e-Visę?

Powódź w Polsce. Krytyczna sytuacja w województwie opolskim i dolnośląskim

Brytyjskie media piszą o powodzi w Polsce. Ta noc była wyjątkowo trudna dla mieszkańców Głuchołaz, Lądka-Zdroju i Kłodzka.

Polak w Holandii pomagał swoim rodakom oszukiwać na zasiłkach

44-letni Polak stanął przed holenderskim sądem za "pomaganie" swoim rodakom mieszkającym w "Kraju tulipanów" w staraniu się o zasiłek dla bezrobotnych. O co chodzi?

Powodzie i podtopienia w Polsce. Nadchodzi koszmarny weekend w wielu województwach

Polska obecnie zmaga się z trudną sytuacją pogodową, a...

Czynsze w Irlandii rosną ponad legalne maksimum. Cierpi co czwarty najemca

W Irlandii, w strefach RPZ, czynsz może rosnąć tylko o 2 proc. w ciągu roku. Tymczasem dla co czwartego najemcy rośnie on szybciej

Przeczytaj także

Ciekawe tematy

Zasiłki mieszkaniowe w Holandii dla Polaków. Jak je uzyskać?

Jak można się starać o zasiłki mieszkaniowe w Holandii. Komu one przysługują i ile wynoszą? Jak złożyć wniosek o huurtoeslag?

Czynsze w Irlandii rosną ponad legalne maksimum. Cierpi co czwarty najemca

W Irlandii, w strefach RPZ, czynsz może rosnąć tylko o 2 proc. w ciągu roku. Tymczasem dla co czwartego najemcy rośnie on szybciej

W UK znikną fizyczne dokumenty imigracyjne. Kto musi się postarać o e-Wizę?

Home Office przechodzi na w pełni zdigitalizowany system imigracyjny. Kto do 1 stycznia 2025 r. potrzebuje postarać się o e-Visę?

Bank Anglii podjął decyzję w sprawie stóp procentowych

Bank Anglii nie obniżył stóp procentowych, zamiast tego postanowił utrzymać je na niezmienionym poziomie 5 proc.

Wprowadzenie kontroli granicznych EES (znów!) zostanie opóźnione

Entry/Exit System (EES) miał zacząć działać od 10 listopada 2024 roku, ale okazuje się, że nie wszystkie kraje są jeszcze gotowe na wdrożenie. Co stoi na przeszkodzie? Jakie problemy mogą wyniknąć z nowych procedur?

Budownictwo przystępnych cenowo mieszkań w Londynie jest na dramatycznie niskim poziomie

W Londynie dramatycznie brakuje niedrogich mieszkań. Dlaczego są takie opóźnienia w budownictwie socjalnym?