I går aftes blev der holdt hovedtale på Googles udviklerkonference Google I/O. Sidste år berettede de om deres planer for AI, men det var lidt diffust. Siden da er det blevet meget mere konkret med lanceringen af Gemini i december 2023. Og udviklingen er gået rigtig stærkt siden da. Nu har Google delt sine planer for den nærmeste fremtid.
Gemini 1.5 Pro
Først og fremmest får Gemini Advanced-abonnenter adgang til Gemini 1.5 Pro, som nu er tilgængelig på 35 sprog. Med en kapacitet på 1 million tokens kan den basere sit svar til dig på op til 1.500 sider PDF, 30.000 kodelinjer eller en times video. Google afslørede også, at kapaciteten vil blive udvidet til 2 millioner tokens!
Workspace
Gemini vil også blive integreret i apps som Gmail, Docs, Sheets, Slides og Drev. Der blev vist eksempler på, hvordan Gmail vil blive i stand til at forstå og holde styr på flere samtidige mailtråde og f.eks. sammenfatte tilbud fra flere afsendere. Men den vil også kunne arbejde på tværs af apps, så man f.eks. automatisk kan gemme kvitteringer fra e-mails i en mappe i Drev, og lade Sheets logge og kategorisere dem.
Android
Fra tidligere på året at have fået smartere søgninger ved hjælp af AI, får Android nu “AI som sin kerne”. Gemini Nano – med mulighed for at bruge tekst, lyd og billeder som både input og output – kommer “senere på året”, hvilket vi tolker som en lancering i Pixel 9 til efteråret. Det blev demonstreret, hvordan Circle to search nu kan løse fysikproblemer og forklare ræsonnementer, samt at den kan advare om svindel i telefonopkald (i hvert fald på engelsk).
Webtjenester
Selvfølgelig bliver Googles stadig stigende antal tjenester på nettet smartere. Især søgefunktionen vil kunne bruge information i realtid, forstå argumentation i flere led og sammenfatte svar fra mange forskellige kilder. Som eksempel blev det vist, hvordan den kunne svare på “find de bedste yogastudier inden for 10 minutter fra mit hjem, og hvad de har af introduktionstilbud”.
Google Foto vil blive i stand til at forstå konteksten, så man f.eks. kan spørge: »Hvad er mit registreringsnummer?«.
AI-værktøjer
Google viste også nye versioner af værktøjer til at generere multimedier. Deres nye model Veo genererede videoer, der så mere virkelige ud end nogensinde. Tekst-til-billede-værktøjet Imagen 3 forstår mere detaljerede beskrivelser og skulle ikke længere have så store problemer med at generere tekst. Endelig var der en demonstration af, hvordan Music AI Toolbox kan hjælpe musikskabere i den kreative proces.
Virkelig imponerede var dog Project Astra, hvor man kan stille spørgsmål i realtid til det, kameraet viser:
For flere detaljer kan du se hele den to timer lange præsentation her:
Læs videre med LB+
Juletilbud - 50% Rabat!
50% På LB+ Total i 1 år!
Prøv LB+ Total i 1 måned
Fuld adgang til alt indhold i 1 måned for 49 kr
LB+ Total 12 måneder
Fuld adgang til alt indhold på Lyd & Billede og L&B Home i 12 måneder
- Adgang til mere end 7.500 produkttests!
- Store rabatter hos vores samarbejdspartnere i LB+ Fordelsklub
- Ugentlige nyhedsbreve med seneste nyheder/li>
- L&B TechCast – en podcast fra L&B
- Deaktivering af annoncer