Един от най-мощните големи езикови модели за AI приложения в момента се разработва от Microsoft, съобщава The Information, като се позовава на свои източници. Това е колкото изненадващо, толкова и закономерно развитие за компанията, която направи огромна инвестиция в създателите на ChatGPT от OpenAI, но освен това и обвързва бъдещето си изцяло с изкуствения интелект.
Моделът на Microsoft за момента е наричан вътрешно MAI-1, като разработката му се ръководи от доскорошния ръководител на AI разработките в Google Мустафа Сюлейман. Преди да мине през IT гигантите, той беше съосновател на стартъпа Inflection, чиито технологии бяха закупени от MS за 650 млн. долара.
Според The Information, обаче, MAI-1 е изцяло нов модел и по-скоро натрупаното ноу-хау и данни от Inflection вече се използват за обучението му. Той е с около 500 млн. параметъра, което е многократно повече в сравнение с досегашните отворени модели на Microsoft и е сравнимо, например, с GPT-4. Той е с трилион параметъра, но през последните месеци бяха внедрени различни иновации, които повишават ефективността, така че крайният резултат може да се окаже сходен.
На пръв поглед изглежда странно Microsoft да отделят огромния изчислителен ресурс, нужен за чисто нов модел, при положение, че са инвестирали 10 млрд. долара в OpenAI и в резултат имат директен достъп до GPT-4 модела, който е интегриран в Copilot и ред други техни приложения. В същото време, обаче, компанията на Сам Алтман беше разтърсена от огромен скандал миналата есен и за няколко дни даже самият той се оказа изхвърлен от нея. Подобна нестабилност на ключов партньор няма как да не притеснява Microsoft, които ясно обвързват бъдещето си с AI.
За крайния потребител така или иначе използваният езиков модел няма значение - той вижда само крайния резултат, "опакован" в приложение, което не е зависимо от OpenAI. Важното е просто да работи надеждно.
Създателите на Windows инвестираха и в разработчика на AI модели Mistral, но това не може да се сравни с усилието, което компанията очевидно прави, за да създаде MAI-1.
Официален коментар по темата няма, но техническият директор на Microsoft Кевин Скот побърза да напише в Linkedin следното: "Ние строим големи суперкомпютри, за да тренираме AI модели. Нашите партньори от OpenAI използват тези компютри, за да тренират перспективни модели и както ние, така и те правим тези модели достъпни в продукти и услуги, за да могат много хора да се възползват от тях. Тази ситуация много ни харесва".
В публикацията си Скот никъде не отрича да се работи по MAI-1, като отбелязва, че понякога в компанията правят собствени AI разработки и "в бъдеще ще има още повече".
От The Information отбелязват, че даже вътре в Microsoft не е окончателно решено каква ще е ролята на новия модел и представянето му при предстоящите тестове ще бъде от решаващо значение. Не е изключено да чуем повече по темата на конференцията за разработчици Build по-късно този месец.