Följ oss här

AI

Google lanserar ”Nano Banana” – Gemini tar AI-bilder till nästa nivå

Google har precis presenterat ett stort steg framåt för sin AI-satsning. Den nya bildmodellen, kallad Gemini 2.5 Flash eller ”Nano Banana”, lyfts redan fram som världens bästa AI-bildredigerare på LMArena och får lovord från användare.

Publicerad

d.

Google Gemini

Google Gemini X

Med löftet om konsekventa resultat, smidiga justeringar och möjligheten att mixa olika stilar siktar Google på mer än bara teknik – man jagar ett genombrott i samma anda som Studio Ghibli-bilderna en gång gav ChatGPT.

En lösning på AI-bildens största problem

Enligt TechSpot är en av de största frustrationerna med AI-bildgenerering är att små ändringar ofta förändrar hela bilden. Med Nano Banana vill Google ändra på det. Modellen gör det möjligt att justera detaljer utan att hela motivet blir förvrängt.

Användare kan exempelvis ladda upp en bild av en person och prova olika kläder, frisyrer eller epoker – utan att ansiktet tappar sin identitet. På samma sätt kan företag skapa varumärkesbilder med samma produkt i olika miljöer, eller låta en karaktär dyka upp i flera scener med bibehållen igenkänning.

Gemini på X

Läs också: Nvidia passerade 4 000 miljarder dollar

Från vardagsrum till fantasivärldar

Google framhäver också kreativiteten. Med så kallad multi-turn-redigering kan användare fortsätta bygga på sina bilder steg för steg – till exempel lägga till möbler och detaljer i ett tomt rum för att få inredningsidéer.

En annan funktion är möjligheten att blanda stilar. Ett exempel är att låta ett klänningsmönster anta fjärilsvingars färger, eller att flytta över designen från en bild till ett objekt i en annan.

Även mer lekfulla alternativ finns, som att kombinera en person och ett husdjur i en ny scen. På så sätt blir bildskapandet mer interaktivt och konsekvent än tidigare.

Skydd mot missbruk

Utvecklingen av allt mer realistiska AI-bilder väcker också oro för missbruk. Google har därför utrustat Nano Banana med både synliga vattenstämplar och osynliga digitala markörer via SynthID, vilket gör att bilderna kan spåras även om de ändrats.

Läs också: Apple vill köpa F1-rättigheterna

Samtidigt pågår en kapplöpning mellan AI-jättar. Elon Musk har lyft fram Groks "Spicy mode", som till skillnad från de flesta andra AI-modeller kan skapa vuxeninnehåll. ChatGPT:s bildgenerator bidrog till att locka nära en miljard användare i april – mycket tack vare den virala spridningen av bilder i Studio Ghibli-stil.

Googles jakt på sitt kulturella ögonblick

Frågan är nu om "Nano Banana" kan bli Googles egen kulturella fullträff. Där ChatGPT vann publikens hjärta med lekfull Ghibli-estetik hoppas Google att deras nya modell ska ta AI-bilder från tekniskt imponerande till allmänt älskade – och på sikt bli det verktyg som både kreatörer och företag väljer framför konkurrenterna.

Läs också: Samsung fortsätter med galna priser

Mimmo Wiestål Fischetti är skribent på Dagens.se och Teksajten.se, där han bevakar nyheter, teknik och samhällsfrågor med fokus på det som påverkar svenska läsare i vardagen. Han har lång erfarenhet av digital publicering och har varit aktiv online sedan mitten av 1990-talet. Genom åren har han följt den snabba utvecklingen inom teknik, politik och digital kultur, med ett särskilt intresse för hur innovation och samhällsförändring hänger ihop. Med en tydlig och tillgänglig stil strävar han efter att göra komplexa frågor begripliga och relevanta för en bred publik. Se fullständig profil på Muck Rack

Annons