Докато текат дебатите между експертите (и недотолкова експертите) дали изкуственият интелект е достигнал нивото, което ще му позволи да измести хората в работната им среда, изследователи от TrackingAI подложиха най-известните модели изкуствен интелект на теста за интелигентност на Mensa Norway.
Първенците
Тази година най-висок резултат (145) имат Grok-4.20 Expert Mode и OpenAI GPT 5.4 Pro Vision, като тридесет и петте въпроса са адаптирани според вида на модела - визуалните отговарят на картинни пъзели, а текстовите - на еквивалентно описание. Веднага след тях се нареждат Gemini 3.1 Pro Preview, OpenAI GPT 5.4 Thinking Vision и OpenAI GPT 5.3 с резултати съответно 141, 139 и 136, предава Visual Capitalist.
Според изследователите средностатистическият човек има IQ около 100 пункта, а над 130 влиза в категорията "гений". Така сред "гениалните" модели се класират още Grok-4.20 Expert Mode Vision (133), OpenAI GPT 5.4 Thinking (133), Meta Muse Spark (133), Gemini 3.1 Pro Preview Vision (132), Qwen 3.5 (130) и Claude-4.6 Opus (130).
С колко са "поумнели" от миналата година
Това, което привлича погледа на експертите, е минималната разлика между първите в класацията. Докато миналата година първенец е бил OpenAI o3 с резултат от 135, второто място се е заемало от Claude-4 Sonnet на Anthropic с 127. Тази разлика от 8 пункта не само липсва през 2026 година, но и първото място се споделя от два модела на различни компании.
Източник: iStock
Това показва, че технологичните гиганти напредват значително и паралелно в развитието си, което прави борбата за първото място по-ожесточена. Миналата година секторът стана свидетел на неетични практики като привличането на специалисти от конкурентите, като едновременно с това много служители загубиха работата си.
Кой изостава
Под нивото на средностатистическия човек остават OpenAI GPT 5.3 Vision, Claude-4.6 Sonnet, Bing Copilot, Perplexity, Mistral Medium 3.1, Claude-4.6 Sonnet Vision и Claude-4.6 Opus Vision. На последните места са Llama 4 Maverick Vision и OpenAI GPT 5.4 Pro със стойности съответно 79 и 73.
За сравнение, последен в миналогодишната класация е Grok-3 Think Vision с резултат 60. Докато тогава едва 10 модела са минали границата от 100 точки, тази година те са 17.
Източник: chillout point
Въпреки това, изследователите съветват "резултатите да се разбират като сравнителен анализ, а не като окончателна мярка за цялостна интелигентност. Причината е, че тестът не измерва всичко, което е важно при реалната употреба на ИИ, като например способност за кодиране, фактическа надеждност, използване на инструменти или производителност в професионални области."
Какво се случва без подготовка
Официалната класация е направена на базата резултатите от публичният IQ-тест на Mensa Norway. Паралелни данни на компанията разглеждат нивото на моделите според така наречен "офлайн тест", който не е публикуван в интернет пространството.
Източник: TrackingAI
Според него първи в класацията е OpenAI GPT 5.5 Pro със 130, докато на онлайн теста достига едва 73. Единствените други модели, при които се забелязва подобно разминаване, макар и значително по-малко, са OpenAI GPT 5.4 и Claude-4.6 Sonnet, а Perplexity има еднакъв резултат и при двете разновидности - 97.
Макар да е интересна, тази класация представя моментна снимка на нивото на справяне с различни задачи на едни от най-популярните AI модели. Динамичността на технологичния сектор обаче позволява всекидневно им развитие и подобряване.
USD
CHF
GBP