OpenAI:s populära AI-chattbot, ChatGPT, får en uppgradering som utökar dess kapacitet bortom textbaserade interaktioner. Användare kommer nu att kunna interagera med ChatGPT med hjälp av röstkommandon och ladda upp bilder. Dessa förbättringar kommer att rullas ut till ChatGPT-prenumeranter inom de närmaste två veckorna. Och kommer att vara tillgängliga för alla andra användare strax därefter.
Med röstkommandon kan användaren helt enkelt säga sin fråga högt och ChatGPT omvandlar tal till text, bearbetar frågan och svarar med en människoliknande röst. OpenAI har investerat i sin Whisper-modell för tal-till-text-funktioner och introducerat en ny text-till-tal-modell för att möjliggöra naturlig ljudgenerering från textinmatningar. Användarna kommer att kunna välja mellan fem olika röster för ChatGPT.
Funktionen för bildkommandon gör det möjligt för användaren att ladda upp bilder, mycket likt Google Lens. ChatGPT analyserar bilden och svarar på frågor som rör det visuella innehållet. Användaren kan också använda ett ritverktyg eller skriva/tala ytterligare frågor för att ge sammanhang till bildbaserade frågor. Detta multimodala tillvägagångssätt bör möjliggöra en mer interaktiv och dynamisk konversation med den artificiella intelligensen.
Även om de nya funktionerna utökar ChatGPT:s kapacitet är OpenAI medvetet om de potentiella risker som är förknippade med syntetiskt tal och bildigenkänning, försäkrar företaget. Illasinnade aktörer kan potentiellt missbruka dessa funktioner för imitation eller bedrägeri.
ChatGPT can now see, hear, and speak. Rolling out over next two weeks, Plus users will be able to have voice conversations with ChatGPT (iOS & Android) and to include images in conversations (all platforms). https://t.co/uNZjgbR5Bm pic.twitter.com/paG0hMshXb
Annons— OpenAI (@OpenAI) September 25, 2023
Funktionen för bildigenkänning har till exempel vissa begränsningar för att skydda den personliga integriteten. ChatGPT har bland annat begränsad förmåga att analysera och göra direkta uttalanden om individer för att undvika missbruk.