Igår kväll hölls inledningstalet på Googles utvecklarkonferens Google I/O. Förra året berättade de om sina planer för AI, men det var lite spretigt. Sedan dess har det blivit desto mer konkret med lansering av Gemini i december 2023. Och utvecklingen har gått rasande snabbt sedan dess. Nu har Google delat med sig av sina planer för den närmaste tiden.

Läs också Nyhet: Googles sökningar blir ännu smartare genom AI Circle to Search och Multisearch ska göra det lättare att hitta information om okända saker

Gemini 1.5 Pro

Först och främst får Gemini Advanced-prenumeranter tillgång till Gemini 1.5 Pro, som nu finns på 35 språk. Med dess kapacitet på 1 miljon tokens kan den basera sitt svar till dig på upp till 1500 sidor PDF, 30 000 rader kod eller video på en timme. Google avslöjade också att kapaciteten ska utökas till 2 miljoner tokens!

Workspace

Gemini kommer även integreras i appar som Gmail, Dokument, Kalkylark, Presentationer och Drive. Det visades exempel på hur Gmail kommer kunna förstå och hålla reda på flera samtidiga mejltrådar, och exempelvis sammanfatta offerter från flera avsändare. Men den kommer även kunna fungera på tvärs av apparna, så att man exempelvis automatiskt kan spara kvitton från mejlen i en mapp på Drive och låta Kalkylark logga och kategorisera dem.

Android

Från att tidigare i år ha fått smartare sökningar med hjälp av AI, kommer Android framöver att ha ”AI som grund”. Gemini Nano, med möjlighet till att använda text, ljud och bilder som både in- och utdata kommer ”senare i år”, vilket vi tolkar som att det lanseras i Pixel 9 i höst. Det demonstrerades hur Circle to search nu kan lösa fysikproblem och förklara resonemanget, samt att det kan varna för bedrägerier i telefonsamtal (åtminstone på engelska).

Webbtjänster

Naturligtvis blir Googles allt fler tjänster på webben smartare. Framför allt kommer Sök att kunna använda realtidsinformation, förstå flerstegsresonemang och sammanfatta svar från många olika källor. Som exempel visades hur den kunde svara på ”hitta de bästa yogastudiorna inom 10 minuter från mitt hem och vad de har för introduktionserbjudanden”.

Annons

Google Foto kommer att kunna förstå sammanhang så att man exempelvis kan fråga ”vad är mitt registreringsnummer?”.

AI-verktyg

Google visade också upp nya versioner av verktyg för att generera multimedia. Deras nya modell Veo genererade videoklipp som såg verkligare ut än någonsin. Text-till-bild-verktyget Imagen 3 förstår mer detaljerade beskrivningar och ska inte längre ha så stora problem att generera text. Slutligen visades hur Music AI Toolbox kan hjälpa musikskapare i den kreativa processen.

Riktigt imponerande var dock Project Astra, där man kan ställa frågor i realtid av vad kameran visar:

För mer detaljer kan du se hela den två timmar långa presentationen här:

Jonas Ekelund

(f. 1969): Journalist och nyhetsredaktör. Jonas har jobbat för Ljud & Bild sedan 2007 med det mesta som kan kallas bärbart. Det vill säga mobiler, trådlösa högtalare och hörlurar. Ibland klampar testandet in på kollegernas områden multirum-ljud, hemmabio och foto. Han startade sin bana som teknikjournalist på IDG och skrev bland annat för PC för Alla, Internetworld och det som senare blev M3.

Nyhet

På Google I/O handlade allt om AI i form av Gemini

Gemini 1.5 Pro

Workspace

Android

Webbtjänster

AI-verktyg

Skriv en kommentar Avbryt svar

Läs hela artikeln med LB+

Erbjudande - 1 månad 10:-

LB+ Total 12 månader

LB+ Total 6 månader!

Slut med ljudlösa AI-videor

AI blev butikschefen från helvetet

Sov gott – eller dö!

OpenAIs hemliga AI-enhet avslöjad

AI försvagar din hjärna

Batteriet är tillverkat av sand

Snacka med din sökmotor

AI avslöjar: Vintergatans svarta hål roterar i galen fart

Hollywood stämmer Midjourney

Hur korkad är AI?

Ladda AA-batterierna med USB

ChatGPT-chattar sparas nu permanent