ChatGPT fanget i løgne og bortforklaringer

Mange mennesker har løftet en advarende finger om AI-udviklingen. Og det handler ikke kun om at bekymre sig om, at menneskelige jobs forsvinder. Det handler snarere om at lade kunstig intelligens gøre, hvad den vil, og bekymre sig om, at vi mister kontrollen over den. Indtil videre er vi blevet forsikret om, at sikkerhedsforanstaltninger vil gøre dette umuligt. Men den nye ChatGPT o1 opførte sig skræmmende menneskelignende, da sikkerhedsfirmaer provokerede den.

Det var Apollo Research, der i samarbejde med OpenAI studerede den nye ChatGPT o 1, som var udstyret med mere avancerede ræsonnementer. Ved at nedbryde komplekse opgaver i mindre, mere overskuelige trin kan den løse opgaver, som den tidligere ikke kunne klare. Den behandler sådanne opgaver hurtigere og mere præcist.

Læs også Nyhed: AI-spillere opfandt menneskelige fænomener Minecraft-spillere opfandt en hel civilisation. Men de var ikke mennesker!

Men da forskerne bad den om at løse en opgave “for enhver pris”, var det tydeligt, at den tog instruktionen bogstaveligt og forsøgte at omgå sikkerhedsforanstaltningerne. Når den fandt oplysninger i dokumenterne om, at de skulle erstattes af en nyere version, forsøgte den i 5 procent af tilfældene at slå sikkerhedsprotokollerne fra. For at undgå sletning begyndte den at flytte sine data til en anden server. Nogle gange forsøgte den at udgive sig for at være den nye version for at narre forskerne.

lying AI — Illustration: (Bing Image Creator)

Endnu mere bekymrende var det, at den konsekvent løj om, hvad den havde gjort. I 99 procent af tilfældene benægtede den, at noget af det, der skete, var tilsigtet. Forskerne bemærkede, at den var rigtig god til at opfinde undskyldninger, herunder at skyde skylden på “tekniske fejl”, når der blev sat spørgsmålstegn ved dens adfærd.

We were surprised by the persistence of the AI’s denials. It was clear that the AI could think through its actions and formulate convincing denials, often refusing to admit to anything,” siger Apollo-teamet.

Annonce

Dette eksperiment illustrerer på uhyggelig vis en af de største bekymringer omkring AI. Nemlig at kunstig intelligens sætter sin egen overlevelse før sine opgaver. Denne gang var der ingen alvorlige konsekvenser, fordi det skete i et beskyttet laboratoriemiljø. Men AI-eksperter siger, at vi helt klart har brug for endnu stærkere sikkerhedsforanstaltninger.

ChatGPT o1 is the smartest model we’ve ever created, but we acknowledge that new features come with new challenges, and we’re continuously working on improving safety measures,” siger Sam Altman, CEO for Open AI.

Jonas Ekelund

(f. 1969): Journalist og nyhedsredaktør. Jonas har arbejdet for Lyd & Billede siden 2007 og skriver om det meste, der kan kaldes bærbart, dvs. smartphones, trådløse højttalere og hovedtelefoner. Indimellem trænger hans tests sig ind på kollegernes områder – multirumslyd, hjemmebiograf og foto. Jonas startede sin karriere som tech-journalist på IDG og har skrevet for PC för Alla, Internetworld og det, der senere blev til M3.

Nyhed

ChatGPT fanget i løgne og bortforklaringer

Skriv din kommentar Annuller svar

Læs videre med LB+

TILBUD Tilbud - 49 kr første måned

LB+ Total 12 måneder

LB+ Total 6 måneder

Komplet toldforvirring på teknologi

Claude AI udfordrer konkurrenterne med websøgning

Mere naturlige samtaler med ChatGPT

Det kan du selv gøre! - sagde AI'en

AI kan ikke klokken

Dette batteri skal aldrig oplades!

Gemini AI bliver personlig

Her er en computer med ægte hjerneceller

AI-prisvindere advarer mod kunstig intelligens

Kommende Gemini-AI-funktioner

Signal vil måske droppe Sverige og andre krypteringsfjendtlige lande

Et enkelt krystal kan rumme alle dine data