Ян Лекун помогна за създаването на технологията, която захранва ChatGPT. Сега той залага бъдещето си на идеята, че големите езикови модели са задънена улица, пише Quartz в свой материал.
През ноември Лекун напусна Meta след повече от десетилетие като главен учен по изкуствен интелект на компанията. Таймингът казваше много.
Само шест месеца по-рано Марк Зукърбърг беше инвестирал милиарди в нова изследователска лаборатория, посветена на изграждането на "свръхинтелигентност" чрез същия подход с големи езикови модели, към който Лекун беше станал все по-скептичен.
За да я ръководи, Зукърбърг избра Александър Уанг от Scale AI - 28-годишен талант, който беше изградил компания за етикетиране на данни, а не програма за изследване на изкуствен интелект. Вместо да остане като почитан ветеран в чужда лаборатория, 65-годишният носител на наградата "Тюринг" реши да започне отначало.
Неговото ново начинание, Advanced Machine Intelligence Labs, стартира уебсайта си през януари с ясна декларация: "Истинският интелект не започва с езика. Той започва със света."
Проблемът с днешните системи
Лекун не е сам в това убеждение. Нарастващ хор от изтъкнати изследователи на изкуствен интелект вярва, че фиксацията на индустрията върху езиковите модели е създала своеобразно тунелно виждане и че пътят към наистина интелигентни машини минава през така наречените "модели на света".
Проблемът с днешните AI системи, както Лекун твърди от години, е че те всъщност не разбират нищо. Големите езикови модели са обучени да предвиждат коя дума идва следваща в последователност. Те са станали забележително добри в това - достатъчно добри, за да пишат поезия, да коригират код и да издържат медицински изпити.
Но те са фундаментално машини за разпознаване на шаблони, които нямат вътрешно представяне как работи реалността.
Това се проявява по очевидни начини. Помолете един AI за генериране на видео да покаже някой как поставя чаша кафе и я взема минута по-късно, и чашата може да промени цвета си, да се премести по масата или да изчезне напълно. Изкуственият интелект няма постоянство на обектите - когнитивно умение, което повечето деца овладяват на една годинка.
Лекун вярва, че това ограничение не е просто инженерен проблем, който да се реши с повече данни и по-големи модели. Според него настоящите системи не могат да планират напред, защото не разбират причина и следствие във физическия свят. Те никога не са докосвали нищо, никога не са се ориентирали в стая, никога не са се справяли с последствията от действията си.
Те са прочели всичко, но не са изпитали нищо.
Различна визия получава форма
Вместо това Лекун и други предлагат AI системи, изградени около вътрешни модели за това как светът всъщност работи. Помислете как можете да си представите как посягате към чаша кафе преди да го направите, предвиждайки че ще бъде топла и тежка, очаквайки как ръката ви трябва да се движи. Днешният изкуствен интелект може да напише стихотворение за кафе. Не може да ви налее чаша.
Това е видът разбиране, което тези изследователи искат да вградят в машините.
Концепцията е привлякла сериозни таланти и пари. Фей-Фей Ли, понякога наричана "кръстницата" на изкуствения интелект, напусна Станфорд, за да основе World Labs. Google DeepMind разработи Genie 3 - система, която създава фотореалистични виртуални светове, в които AI агентите могат да учат чрез проба и грешка.
Дори xAI на Илон Мъск се присъедини към надпреварата.
Въпреки ентусиазма обаче, моделите на света остават страничен залог. Най-големите чекове в изкуствения интелект все още отиват при компаниите за езикови модели.
OpenAI, Anthropic и Google инвестират десетки милиарди в разширяването на точно подхода, за който ЛеКун казва, че е обречен.
Лекун и друг път е заставал зад идеи, които не са "на мода". През 80-те години той подкрепи невронните мрежи, когато голяма част от науката ги беше изоставила. По-късно именно те направиха така омразните му чатботове (но и цялата AI революция) възможни.


USD
CHF
EUR
GBP