Mint a The Verge kiemeli, az új modell a Google Gemini 1.5 Flash és az Anthropic Claude 3 Haiku versenytársa lehet. Az OpenAI érdeke is az, hogy a fejlesztők ne más cégek megoldásai felé kacsintgassanak, egy kis verseny pedig a piacnak is jót tehet.
Ami az újdonság képességeit illeti, az OpenAI közlése szerint a GPT-4o mini 82 százalékos eredményt ért el az MMLU nevű bechmark-teszten, mely 16 000 feleletválasztós kérdést tartalmaz 57 akadémiai témában. Viszonyításképp: a GPT-3.5-ös modell 70 százalékot ért el, míg a GPT-4o 88,7 százalékot. A jelenlegi csúcstartó a teszten a Google Gemini Ultra 90 a százalékos eredményével, míg a 4o mini közvetlen konkurensei, a már említett Claude 3 Haiku és a Gemini 1.5 Flash 75,2 és 78,9 százalékot értek el. (Azt azonban érdemes megjegyezni, hogy sok tényezőtől függ az eredmény, erre a The New York Times is felhívta a figyelmet egy cikkében.)
I Forrás: hvg.hu