Okategoriserade
Så lär sig robotar som människor – Apple banar väg med banbrytande AI-träning
Ny forskning: Så tränas nästa generations humanoida robotar snabbare, billigare och smartare.

Tänk dig en framtid där robotar lär sig genom att titta på människor – ur våra egna ögon. Det är precis vad Apple och några av USA:s främsta universitet nu experimenterar med. Genom att använda förstapersonsvideor, inspelade med bland annat Apple Vision Pro, kan forskarna ge robotar en helt ny förståelse för hur vi människor rör oss, arbetar och interagerar med saker omkring oss.
LÄS OCKSÅ: Beats nya kabel – den “officiella” Apple-lösningen för CarPlay med USB-C
Vision Pro förvandlas till robotlärare
Bakom projektet står forskare från Apple, MIT, Carnegie Mellon, University of Washington och UC San Diego. Målet: att lära humanoida robotar utföra avancerade uppgifter genom att visa dem tusentals klipp där människor manipulerar olika föremål – allt sett ur människans perspektiv, med hjälp av Vision Pro:s inbyggda kamera och AR-teknik, skriver 9to5Mac.
Med över 25 000 inspelade mänskliga demonstrationer och 1 500 robotdemonstrationer i bagaget har teamet tagit fram en unik databas (PH2D). Den används sedan för att träna robotarnas AI, som får se och analysera varje rörelse ur förstapersonsvinkel.
LÄS OCKSÅ: Äntligen! Byt till Google Translate som standard i din iPhone
Billigare och enklare robotträning
Att samla in träningsdata på traditionellt sätt – där robotar fjärrstyrs och varje rörelse spelas in – är både tidskrävande och dyrt. Apple-teamet ville hitta en mer effektiv lösning. Därför skapade de en särskild app till Vision Pro, men även ett billigare alternativ: de 3D-printade ett fäste för att montera en ZED Mini Stereo-kamera på exempelvis Meta Quest 3. Det här gjorde det möjligt att spela in högkvalitativa rörelser snabbt och till en betydligt lägre kostnad.
En smart detalj: eftersom människor rör sig mycket snabbare än robotar, saktade forskarna ner videomaterialet fyra gånger vid träning – så att roboten faktiskt kan hänga med.
HAT – AI:n som förstår både människa och robot
Hjärnan bakom framgångarna är Human Action Transformer (HAT), en AI-modell som tränas på både mänskliga och robotiska rörelser i ett och samma system. Istället för att separera data från människor och robotar, lär sig HAT att tolka och härma rörelser oavsett om de kommer från en människa eller en maskin. Det gör AI:n mer flexibel och effektiv – och faktiskt bättre på att ta sig an nya, oväntade utmaningar.
LÄS OCKSÅ: Apple gör sig redo för en vikbar revolution – iPhone Fold tar över tronen
Vad betyder det här för framtiden?
Med Apples metod kan humanoida robotar snart bli betydligt mer användbara i våra hem och på arbetsplatser. Samtidigt väcker det såklart frågor: Är tanken på robotar som kan lära sig av oss inspirerande, skrämmande eller kanske bara onödig?