TESTS Bil & Mobilitet Computer Sport & Træning Gaming Mobil Smart Home Teknologi
L&B’s julekalender 2024 Deltag her!

Nyhed

ChatGPT fanget i løgne og bortforklaringer

AI-værktøjet forsøgte at bryde reglerne og undgå nedlukning på en bekymrende måde.

Af / 11/12/2024 - 13:15
ChatGPT fanget i løgne og bortforklaringer

Mange mennesker har løftet en advarende finger om AI-udviklingen. Og det handler ikke kun om at bekymre sig om, at menneskelige jobs forsvinder. Det handler snarere om at lade kunstig intelligens gøre, hvad den vil, og bekymre sig om, at vi mister kontrollen over den. Indtil videre er vi blevet forsikret om, at sikkerhedsforanstaltninger vil gøre dette umuligt. Men den nye ChatGPT o1 opførte sig skræmmende menneskelignende, da sikkerhedsfirmaer provokerede den.

Det var Apollo Research, der i samarbejde med OpenAI studerede den nye ChatGPT o 1, som var udstyret med mere avancerede ræsonnementer. Ved at nedbryde komplekse opgaver i mindre, mere overskuelige trin kan den løse opgaver, som den tidligere ikke kunne klare. Den behandler sådanne opgaver hurtigere og mere præcist.

Læs også AI-spillere opførte sig som mennesker Minecraft-spillere opfandt en hel civilisation. Men de var ikke mennesker!

Men da forskerne bad den om at løse en opgave “for enhver pris”, var det tydeligt, at den tog instruktionen bogstaveligt og forsøgte at omgå sikkerhedsforanstaltningerne. Når den fandt oplysninger i dokumenterne om, at de skulle erstattes af en nyere version, forsøgte den i 5 procent af tilfældene at slå sikkerhedsprotokollerne fra. For at undgå sletning begyndte den at flytte sine data til en anden server. Nogle gange forsøgte den at udgive sig for at være den nye version for at narre forskerne.

lying AI
Illustration: (Bing Image Creator)

Endnu mere bekymrende var det, at den konsekvent løj om, hvad den havde gjort. I 99 procent af tilfældene benægtede den, at noget af det, der skete, var tilsigtet. Forskerne bemærkede, at den var rigtig god til at opfinde undskyldninger, herunder at skyde skylden på “tekniske fejl”, når der blev sat spørgsmålstegn ved dens adfærd.

We were surprised by the persistence of the AI’s denials. It was clear that the AI could think through its actions and formulate convincing denials, often refusing to admit to anything,” siger Apollo-teamet.

Annonce

Dette eksperiment illustrerer på uhyggelig vis en af de største bekymringer omkring AI. Nemlig at kunstig intelligens sætter sin egen overlevelse før sine opgaver. Denne gang var der ingen alvorlige konsekvenser, fordi det skete i et beskyttet laboratoriemiljø. Men AI-eksperter siger, at vi helt klart har brug for endnu stærkere sikkerhedsforanstaltninger.

ChatGPT o1 is the smartest model we’ve ever created, but we acknowledge that new features come with new challenges, and we’re continuously working on improving safety measures,” siger Sam Altman, CEO for Open AI.

Jonas Ekelund
(f. 1969): Journalist og nyhedsredaktør. Jonas har arbejdet for Lyd & Billede siden 2007 og skriver om det meste, der kan kaldes bærbart, dvs. smartphones, trådløse højttalere og hovedtelefoner. Indimellem trænger hans tests sig ind på kollegernes områder – multirumslyd, hjemmebiograf og foto. Jonas startede sin karriere som tech-journalist på IDG og har skrevet for PC för Alla, Internetworld og det, der senere blev til M3.

Skriv din kommentar

Din e-mailadresse vil ikke blive publiceret. Krævede felter er markeret med *

Læs videre med LB+

50%

Juletilbud - 50% Rabat!

50% På LB+ Total i 1 år!

Prøv LB+ Total i 1 måned

Fuld adgang til alt indhold i 1 måned for 49 kr

LB+ Total 12 måneder

Fuld adgang til alt indhold på Lyd & Billede og L&B Home i 12 måneder

650,-
49,- / for 1 måned
108,- / mnd
Med et abonnement får du også:
  • Adgang til mere end 7.500 produkttests!
  • Store rabatter hos vores samarbejdspartnere i LB+ Fordelsklub
  • Ugentlige nyhedsbreve med seneste nyheder/li>
  • L&B TechCast – en podcast fra L&B
  • Deaktivering af annoncer
Vi har ingen bindingsperiode, du kan sige abonnementet op, når du vil.
Annonce

Mikroskopiske sorte huller kan være overalt

Google Gemini 2.0 er nu her

ChatGPT løj egoistisk

Googles kvantechip slår alle rekorder

AI-spillere opførte sig som mennesker

SpaceX skal levere månebil fra konkurrent

Nvidias AI Fugatto skaber nye lyde

Månesten forvirrer forskere

Træsatellit i kredsløb om jorden

Flyt dig, Google - her kommer AI-søgningen!

Apple Intelligence kommer også til brugere i EU

Google-robot vil overtage din skærm