Följ oss här

AI

Google lanserar ”Nano Banana” – Gemini tar AI-bilder till nästa nivå

Google har precis presenterat ett stort steg framåt för sin AI-satsning. Den nya bildmodellen, kallad Gemini 2.5 Flash eller ”Nano Banana”, lyfts redan fram som världens bästa AI-bildredigerare på LMArena och får lovord från användare.

Publicerad

d.

Google Gemini

Google Gemini X

Med löftet om konsekventa resultat, smidiga justeringar och möjligheten att mixa olika stilar siktar Google på mer än bara teknik – man jagar ett genombrott i samma anda som Studio Ghibli-bilderna en gång gav ChatGPT.

En lösning på AI-bildens största problem

Enligt TechSpot är en av de största frustrationerna med AI-bildgenerering är att små ändringar ofta förändrar hela bilden. Med Nano Banana vill Google ändra på det. Modellen gör det möjligt att justera detaljer utan att hela motivet blir förvrängt.

Användare kan exempelvis ladda upp en bild av en person och prova olika kläder, frisyrer eller epoker – utan att ansiktet tappar sin identitet. På samma sätt kan företag skapa varumärkesbilder med samma produkt i olika miljöer, eller låta en karaktär dyka upp i flera scener med bibehållen igenkänning.

Gemini på X

Läs också: Nvidia passerade 4 000 miljarder dollar

Från vardagsrum till fantasivärldar

Google framhäver också kreativiteten. Med så kallad multi-turn-redigering kan användare fortsätta bygga på sina bilder steg för steg – till exempel lägga till möbler och detaljer i ett tomt rum för att få inredningsidéer.

En annan funktion är möjligheten att blanda stilar. Ett exempel är att låta ett klänningsmönster anta fjärilsvingars färger, eller att flytta över designen från en bild till ett objekt i en annan.

Även mer lekfulla alternativ finns, som att kombinera en person och ett husdjur i en ny scen. På så sätt blir bildskapandet mer interaktivt och konsekvent än tidigare.

Skydd mot missbruk

Utvecklingen av allt mer realistiska AI-bilder väcker också oro för missbruk. Google har därför utrustat Nano Banana med både synliga vattenstämplar och osynliga digitala markörer via SynthID, vilket gör att bilderna kan spåras även om de ändrats.

Läs också: Apple vill köpa F1-rättigheterna

Samtidigt pågår en kapplöpning mellan AI-jättar. Elon Musk har lyft fram Groks "Spicy mode", som till skillnad från de flesta andra AI-modeller kan skapa vuxeninnehåll. ChatGPT:s bildgenerator bidrog till att locka nära en miljard användare i april – mycket tack vare den virala spridningen av bilder i Studio Ghibli-stil.

Googles jakt på sitt kulturella ögonblick

Frågan är nu om "Nano Banana" kan bli Googles egen kulturella fullträff. Där ChatGPT vann publikens hjärta med lekfull Ghibli-estetik hoppas Google att deras nya modell ska ta AI-bilder från tekniskt imponerande till allmänt älskade – och på sikt bli det verktyg som både kreatörer och företag väljer framför konkurrenterna.

Läs också: Samsung fortsätter med galna priser

Jag är skribent på Media Group Denmark och skriver för de svenska plattformarna Dagens.se och Teksajten.se. Under det senaste året på MGDK har jag fokuserat på nyheter, teknik och samhälle, med ett tydligt mål att göra komplexa ämnen begripliga för alla. Jag har varit aktiv online sedan 1995 och är fortfarande fascinerad av den ständigt föränderliga digitala världen – från ny teknik och politik till samhällsförändringar och nya sätt att berätta historier – Muck Rack

Annons