Följ oss här

AI

Nu kan du prata med ChatGPT utan att lämna tråden

ChatGPTs röstläge blir nu en del av den vanliga chatten i stället för en separat vy. Du kan prata vidare i samma tråd, se en löpande transkribering av samtalet och få visuella hjälpmedel som kartor och bilder när det passar, skriver Engadget.

Publicerad

d.

Fajri Mulia Hidayat / Shutterstock.com

Röstchatten flyttar in i pågående konversationer

OpenAI ändrar hur Voice Mode fungerar både på webben och i apparna. I stället för att röstläget öppnar en fristående “orb”-skärm sker röstchatten direkt i den chat du redan är inne i. Det gör att du kan fortsätta ett resonemang utan att hoppa mellan lägen, och samtidigt följa vad som sägs i textform på skärmen, enligt OpenAI

Live-transkribering och visuella svar

När du pratar med ChatGPT visas en live-transkribering i realtid. OpenAI kopplar också ihop röstsvaren med visuella element i chatten. I Engadgets exempel kunde tjänsten visa en lista med bagerier på en karta och bilder på bakverk som komplement till röstsvaren. Tanken är att röst ska fungera lika “multimodalt” som resten av ChatGPT – alltså kunna blanda text, bild och andra format i samma flöde, skriver Engadget

Så startar du röstläget – och byter tillbaka om du vill

Läs också: Nvidia passerade 4 000 miljarder dollar

Röstchatten startas via röstikonen (vågforms/mikrofon-symbolen) bredvid textfältet. De flesta användare får den integrerade upplevelsen som standard, men OpenAI behåller valet för den som gillar det gamla upplägget. I inställningarna går det att slå på “Separate Mode” för att återgå till den fristående röstvyn, enligt OpenAI. 

Liknande spår hos Google – men OpenAI vill göra röst mer informativt

Google har parallellt experimenterat med att göra Gemini Live mer uttrycksfullt, bland annat genom att markera detaljer i video med visuella överlägg. OpenAIs nya upplägg är inte lika “reaktivt” mot video, men har samma mål: att göra röstkonversationer mer användbara genom att låta dig se det modellen pratar om i samma stund, enligt Axios

Varför det här spelar roll

För många användare är röst snabbare och mer naturligt än att skriva. När röst nu ligger i samma tråd som textchatten blir det enklare att spara, bläddra tillbaka och fortsätta resonemang senare – med transkriberingen kvar i historiken. Samtidigt gör kombinationen av röst och visuella svar att ChatGPT kan guida dig mer konkret i allt från resplaner till recept och research. 

Läs också: Apple vill köpa F1-rättigheterna

Läs också: Samsung fortsätter med galna priser

Jag är skribent på Media Group Denmark och skriver för de svenska plattformarna Dagens.se och Teksajten.se. Under det senaste året på MGDK har jag fokuserat på nyheter, teknik och samhälle, med ett tydligt mål att göra komplexa ämnen begripliga för alla. Jag har varit aktiv online sedan 1995 och är fortfarande fascinerad av den ständigt föränderliga digitala världen – från ny teknik och politik till samhällsförändringar och nya sätt att berätta historier – Muck Rack

Annons