Följ oss här

AI

Googles nya AI tar nästa steg – kan själv klicka runt på webben

Googles senaste AI-modell, Gemini 2.5 Computer Use, tar ett kliv närmare verklig autonomi.

Publicerad

d.

Foto: Summit Art Creations / Shutterstock.com

Systemet kan nämligen själv navigera runt på webben och utföra uppgifter direkt i webbläsaren – precis som en människa, rapporterar The Verge.

AI som agerar på egen hand

Gemini 2.5 Computer Use använder visuell förståelse och logiskt resonemang för att tolka instruktioner och genomföra handlingar på skärmen. Det kan handla om att fylla i formulär, klicka på knappar eller testa användargränssnitt – helt utan manuell inblandning.

Google uppger att verktyget i nuläget kan utföra 13 olika typer av handlingar. Det gör det möjligt att använda modellen i situationer där API-åtkomst saknas, till exempel vid testning av webbappar eller för att automatisera återkommande uppgifter.

Bygger vidare på tidigare AI-experiment

Den nya tekniken är en fortsättning på Googles tidigare projekt AI Mode och Project Mariner, där AI-agenter kunde utföra enklare webbaserade uppgifter som att lägga till produkter i en kundvagn.

Läs också: Nvidia passerade 4 000 miljarder dollar

Med Gemini 2.5 Computer Use tar Google nu det konceptet flera steg längre – mot en AI som inte bara förstår text, utan också kan agera självständigt i digitala miljöer.

Tillgänglig för utvecklare redan nu

Verktyget finns nu tillgängligt för utvecklare via Google AI Studio och Vertex AI. I en demonstration visar Google hur modellen på egen hand navigerar runt i en webbläsare och utför uppgifter baserat på en enkel instruktion.

Det markerar ännu ett steg i kapplöpningen om att skapa AI-system som inte bara tänker – utan också handlar. Se videon nedan. 

Google for Developers
Google for Developers / YouTube

Läs också: Apple vill köpa F1-rättigheterna

Läs också: Samsung fortsätter med galna priser

Jag är skribent på Media Group Denmark och skriver för de svenska plattformarna Dagens.se och Teksajten.se. Under det senaste året på MGDK har jag fokuserat på nyheter, teknik och samhälle, med ett tydligt mål att göra komplexa ämnen begripliga för alla. Jag har varit aktiv online sedan 1995 och är fortfarande fascinerad av den ständigt föränderliga digitala världen – från ny teknik och politik till samhällsförändringar och nya sätt att berätta historier – Muck Rack

Annons