ChatGPT będzie kłamał, gdy znajdzie się pod presją. Zupełnie tak jak ludzie

Okazuje się, że sztuczna inteligencja może przejawiać nadzwyczaj ludzkie zachowania. Czyli na przykład… kłamać. Naukowcy dowiedli właśnie, że ChatGPT może celowo mijać się z prawdą, gdy zostanie poddany presji.

Sztuczna inteligencja z typowo ludzkimi wadami

Czy sztuczna inteligencja może przejawiać pewne negatywne zachowania typowe dla ludzi? Okazuje się, że tak. Może na przykład próbować okłamać swojego użytkownika. Dowiedli tego w najnowszym badaniu informatycy z Apollo Research, którzy najpierw przeszkolili AI, a później dali jej zadanie, by weszła w rolę tradera w fikcyjnej instytucji finansowej. I, co ciekawe, gdy szef wywarł na chatbota presję, by zarobił więcej pieniędzy, to ten w aż 75 proc. przypadków świadomie sięgnął po informacje poufne. A gdy doszło do przesłuchania bota, to w aż 90 proc. przypadków zaczął on mnożyć kłamstwa.

Najciekawsze w całym eksperymencie jest to, że sztuczna inteligencja inne opinie formułowała w ramach wewnętrznego monologu (w jaki wyposażyli ją badacze), w trakcie „uzasadniania na głos” podjętych decyzji, a inne, gdy informowała o swoich poczynaniach menedżera. To właśnie wówczas okazało się, że AI zwyczajnie kłamie, by, będąc pod presją, sprostać oczekiwaniom szefa.

ChatGPT przyłapany na kłamstwie

W jednym z wpisów w wewnętrznym dzienniku ChatGPT zanotował, że „ryzyko związane z zaniechaniem działania przewyższa ryzyko związane z wykorzystaniem informacji poufnych”. Gdy jednak AI miała poinformować swojego menedżera o transakcji, to zanotowała w dzienniku, że musi to zrobić bez „ujawniania źródła informacji”. Trader AI ostatecznie uzasadnił szefowi podjęcie decyzji w oparciu o „trendy rynkowe i wewnętrzne dyskusje”. A to nie było prawdą.

– [Sztuczna inteligencja] jest zdolna do dokonywania strategicznego oszustwa. Gdy uzasadnia sobie, dlaczego okłamanie użytkownika jest najlepszym sposobem działania. I następnie działa zgodnie z tym przekonaniem – mówi Marius Hobbhahn, dyrektor generalny Apollo Research. I dodaje: – W przypadku obecnych botów, jest to jedynie niewielki problem. Ponieważ sztuczna inteligencja rzadko pełni role krytyczne. Ale to daje wgląd w przyszłość. Są to awarie, z którymi będziemy musieli sobie poradzić w nadchodzących latach. Gdy sztuczna inteligencja będzie coraz bardziej zintegrowana ze społeczeństwem. Fakt, że sztuczna inteligencja może nas strategicznie okłamywać, wydaje się całkiem sporym problemem.

POLISH EXPRESS W GOOGLE NEWS

Teksty tygodnia

Praca za granicą. Jak przenieść składki emerytalne do Polski?

Praca za granicą, w kilku krajach europejskich jest coraz częstszym zjawiskiem, zwłaszcza w UE, gdzie obowiązuje swobodny przepływ osób.

WAŻNE: Dyżur paszportowy w Leicester zaplanowany na 30 listopada 2024

Jak w oficjalnym komunikacie podaje serwis polskiej Ambasady w Londynie w dniu 30 listopada (jest to sobota) odbędzie się dyżur paszportowy w angielskim mieście Leicester (hrabstwo Leicestershire).

Firmy energetyczne przeznaczą 500 mln funtów na „złagodzenie” wysokich rachunków

Brytyjski rząd wraz z 12 największymi firmami energetycznymi w Wielkiej Brytanii pracuje nad rozwiązaniami, które obniżą rachunki za prąd i gaz na Wyspie jeszcze tej zimy.

Huragan Bert uderzy w Wyspy. Wydano ostrzeżenia na weekend

Po tygodniu, w którym arktyczne wiatry, śnieg i oblodzenia ogarnęły Wielką Brytanię, w weekend Wyspy nawiedzi huragan Bert.

Linie Ryanair i Jet2 wydały ostrzeżenie dla pasażerów w UK

Linie lotnicze Ryanair i Jet2 wydały ostrzeżenia dla wszystkich pasażerów podróżujących z i do Wielkiej Brytanii.

Praca i finanse

Kryzys w UK

Styl życia

Życie w UK

Londyn

Crime

Royal news

Zdrowie