Setting New Standards for Multimodal AI Competing with ChatGPT – The Breaking AI

Apple har publicerat en omfattande studie om MM1, en ny multimodal stor språkmodell (MLLM) som effektivt integrerar text- och bilddata. MM1 utmärker sig genom sin förmåga till få-skottsinlärning och visar överlägsen förståelse och resonemang över olika benchmarks. Forskningen belyser vikten av noggrant utvalda data och MM1:s skalbarhet, inklusive användningen av Mixture-of-Experts (MoE) för att nå 30 miljarder parametrar. MM1:s förmåga att tolka både visuell och textuell data positionerar den som en stark konkurrent till OpenAI:s ChatGPT, särskilt i applikationer som kräver multimodal analys. Apples MM1 sätter en ny standard för multimodal AI och bidrar med en detaljerad färdplan för utvecklingen av framtida MLLM:er.