Скандал помрачи дебюта на най-новия AI модел на компанията на Илон Мъск xAI. Grok 4 беше представен от най-богатия човек в света като "максимално търсещ истината" и действително резултатите му са много добри... но се оказа, че по редица въпроси изкуственият интелект се консултира с написаното от милиардера, докато оформя отговорите си.
Компанията Artificial Analysis тества Grok 4, като му даде най-високата оценка в своя индекс - 73 пункта при 70 за конкурентните флагмански OpenAI o3 и Gemini 2.5 Pro, както и 64 за Anthropic Claude 4 Opus.
Това е първи случай, в който моделът на xAI излиза на първо място. Той води и при тестовете на уменията по програмиране и решаване на математически задачи. Контекстовият прозорец е един от най-големите в индустрията - 256 хиляди токена, но цената е малко по-висока от тази на Gemini 2.5 Pro и о3.
xAI gave us early access to Grok 4 - and the results are in. Grok 4 is now the leading AI model.
— Artificial Analysis (@ArtificialAnlys) July 10, 2025
We have run our full suite of benchmarks and Grok 4 achieves an Artificial Analysis Intelligence Index of 73, ahead of OpenAI o3 at 70, Google Gemini 2.5 Pro at 70, Anthropic Claude… pic.twitter.com/Vc9781SIzd
Grok 4 е тестван през API, което може да е различна версия от тази, която премиум потребителите на Twitter вече могат да използват. Ключово обаче е че така не се вижда симулацията на мисловен процес, която се прави при изготвянето на отговора на запитването.
Не е такава ситуацията при използването на уеб интерфейса на Grok. Именно там редови потребители и технологични журналисти установиха, че при набирането на информация по някои теми ботът има допълнителна стъпка, която изисква от него да се консултира с написаното в профила на Илон Мъск по дадения въпрос.
Босът на xAI още при дебюта на Grok твърдеше, че целта е да създаде изкуствен интелект, който не е бил обект на политическа цензура. Неотдавна той сподели негодуванието си, че чатботът продължава да е прекалено woke и обяви, че ще го използва, за да отредактира целия използван за "трениране" информационен масив.
Grok 4 decides what it thinks about Israel/Palestine by searching for Elon's thoughts. Not a confidence booster in "maximally truth seeking" behavior. h/t @catehall. Screenshots are mine. pic.twitter.com/WFAG3FOG10
— Ramez Naam (@ramez) July 10, 2025
Какво точно се е случило след това не е ясно (xAI не следват индустриалните стандарти за прозрачност), но Grok докара на Мъск нов скандал, след като изведнъж започна да бълва антисемитски тиради.
Така или иначе, милиардерът е известен с това, че публикува в X/Twitter почти непрестанно и по всякакви теми. Така че може да се каже, че Grok 4 е най-близката до момента имплементация в реалния свят на sci-fi сюжета за суперкомпютъра, в който се е "преселил" неговият създател.