Этот китайский стартап лидирует среди ИИ с открытым исходным кодом

Кай-Фу Ли, эксперт по искусственному интеллекту и известный инвестор, который помог Google и Microsoft закрепиться в Китае, утверждает, что его новый стартап 01.AI создаст лучшие приложения генеративного искусственного интеллекта.

За несколько дней после своего выхода модель 01.AI, Yi-34B, взлетела на первое место в рейтинге, который ведет стартап Hugging Face, сравнивающий возможности языковых моделей искусственного интеллекта по различным стандартным критериям автоматизированного интеллекта. Спустя несколько месяцев модифицированные версии модели 01.AI постоянно попадают в число лучших моделей, доступных разработчикам и компаниям, в списке Hugging Face и других таблицах лидеров. В понедельник стартап запустил "мультимодальную" модель ИИ под названием Yi-VL-34B, которая может обрабатывать изображения и обсуждать их содержимое.

OpenAI, Google и большинство других компаний, занимающихся разработкой ИИ, жестко контролируют свои технологии, но 01.AI раздает свои модели ИИ в надежде вдохновить лояльную базу разработчиков, которая поможет ей выпустить несколько убийственных приложений для ИИ. 01.AI, основанная в июне прошлого года, привлекла 200 миллионов долларов инвестиций от китайского гиганта электронной коммерции Alibaba и других компаний и оценивается более чем в 1 миллиард долларов, по данным Pitchbook.

Основатель и генеральный директор стартапа - Кай-Фу Ли, известный инвестор, который проводил новаторские исследования в области искусственного интеллекта, прежде чем основать лабораторию Microsoft в Пекине и затем возглавить китайский бизнес Google до 2009 года, за год до того, как компания полностью ушла из этой страны. Он говорит, что создание Yi-34B - это кульминация всей его жизни в попытках создать более интеллектуальные машины.

"Это было видением всей моей карьеры", - говорит Ли по телефону Zoom из красиво оформленной квартиры в Пекине. "Слишком долго нам приходилось учить язык компьютеров - нам действительно нужны системы, которые понимают наш язык, то есть речь и текст". На китайском языке 01.AI известна как 零一万五, Ling-Yi Wan-Wu, что означает "ноль-один, все" и отсылает к отрывку из даосского текста Tao Te Ching.

01.AI - один из ведущих китайских претендентов в гонке ИИ, которую начали OpenAI и ChatGPT и в которой до сих пор доминировали американские компании. Ли говорит, что его компания стремится возглавить следующий этап этой революции, создавая одни из первых "убийственных приложений", построенных на возможностях языковых моделей, которые приносят 01.AI значительные доходы. "Приложения, победившие в мобильную эпоху, - это приложения, ориентированные на мобильные устройства, такие как Uber, WeChat, Instagram, TikTok", - говорит Ли. "Инструменты нового поколения не должны больше походить на Office - Word, Excel, PowerPoint - это неправильный путь".

По словам Ли, инженеры 01.AI экспериментируют с различными приложениями, ориентированными на искусственный интеллект, для офисной работы, творчества и социальных сетей. По его словам, планируется, что они станут успешными во всем мире, подобно тому, как китайская социальная сеть TikTok и интернет-магазин Temu являются топовыми приложениями среди американских потребителей.

Ни одно из приложений 01.AI еще не запущено, но языковая модель стартапа с открытым исходным кодом уже завоевала поклонников на Западе. "Для многих вещей это лучшая модель, даже по сравнению с моделями с 70 миллиардами параметров", которые, как можно ожидать, будут вдвое способнее, говорит Джереми Ховард, эксперт по ИИ, недавно основавший Answer AI, еще одно новое предприятие, которое будет заниматься как исследованиями в области ИИ, так и разработкой приложений для ИИ.

Пионер ИИ

Ли сделал заметную карьеру в области ИИ. После эмиграции из Тайваня в США и учебы в средней школе в Ок-Ридже, штат Теннесси, он изучал информатику в Колумбийском университете и университете Карнеги-Меллон, получив степень доктора философии за диссертацию, включавшую разработку передовой для того времени системы распознавания речи.

В 1990 году Ли начал работать в Apple в качестве научного сотрудника, в 1996 году перешел в Silicon Graphics, а в 1998 году вернулся в Китай, чтобы помочь создать Microsoft Research Asia - ставшую легендарной пекинскую лабораторию, которая помогла подготовить бесчисленное множество выдающихся китайских инженеров и руководителей. В 2005 году он стал президентом поискового бизнеса Google в Китае, а в 2009 году покинул компанию, чтобы основать собственную инвестиционную фирму Sinovation Ventures, работающую в процветающей сейчас китайской технологической индустрии.

По мере того как рост смартфонов в Китае привел к быстрому росту технологий, Sinovation поддержала ряд успешных китайских стартапов в области ИИ, включая Megvii, компанию по распознаванию изображений, и TuSimple, компанию, работающую над автономным грузовым транспортом. Ли стал защитником китайской индустрии ИИ, ездил в США, призывая китайских аспирантов вернуться на родину для создания проектов в области ИИ, а в 2018 году опубликовал книгу AI Superpowers, в которой утверждал, что китайские лаборатории и компании в области ИИ скоро будут конкурировать с американскими благодаря обилию талантов, данных и пользователей в стране. Однако Ли также часто выступал за сотрудничество между США и Китаем.

Публикация книги "Сверхспособности ИИ" совпала с растущим осознанием на Западе того, что Ли, по-видимому, прав, поскольку китайская технологическая индустрия находится на пути к тому, чтобы соперничать с США, а возможно, и затмить их. Политики и аналитики в Вашингтоне заговорили о том, что Китай стремится бросить вызов гегемонии США во всем мире, и заговорили о рисках, которые это может повлечь.

Это создало проблемы для тех, кто пытается навести мосты между Китаем и США. В 2019 году компания Sinovation Ventures закрыла свой офис в Кремниевой долине, сославшись на растущие трудности, связанные с заключением сделок с американскими компаниями. В октябре того же года правительство США предприняло прямые действия против китайской индустрии ИИ, введя санкции против Megvii в связи с использованием правительством технологии распознавания лиц этой компании.

Наведение мостов

Выпустив модель ИИ Yi-34B от 01.AI с открытым исходным кодом, Ли вновь занялся наведением мостов. Спустя несколько месяцев после выхода Yi-34B на Западе стали появляться модифицированные версии, превосходящие ее показатели в таблице лидеров модели Hugging Face. Некоторые страны США и Европы строят свои стратегии ИИ на основе китайской модели, которая хорошо владеет мандаринским и английским языками.

"Это действительно хорошая модель, на которую многие опираются", - сказал Клеман Деланж, генеральный директор HuggingFace, на брифинге в ноябре, вскоре после выхода модели 01.AI.

Деланж отметил, что языковые модели с открытым кодом быстро совершенствуются и могут быть лучше, чем лидирующий на рынке GPT-4 от OpenAI для некоторых специализированных задач. Однако он отметил, что многие из лучших моделей с открытым исходным кодом были созданы за пределами США, и сказал, что 01.AI может получить выгоду от инноваций, которые появятся вокруг его модели. "Американские компании стали немного менее открытыми и прозрачными", - сказал он на брифинге. "Но с искусственным интеллектом связана интересная динамика: чем больше компания выпускает открытых исходников, тем больше развивается экосистема, и тем сильнее она становится в создании ИИ."

Мета Llama 2 - редкий пример лучшей модели с открытым исходным кодом от американской компании, и это вызов гиганта социальных сетей OpenAI, Microsoft, Google и другим крупным технологическим конкурентам, инвестирующим значительные средства в генеративный ИИ. Meta решила выпустить свою языковую модель ИИ под лицензией, допускающей коммерческое повторное использование, но с некоторыми оговорками.

Yi-34B и Llama 2, похоже, имеют больше общего, чем просто ведущие модели ИИ с открытым исходным кодом. Вскоре после выхода китайской модели некоторые разработчики заметили, что в коде 01.AI ранее встречались упоминания о модели Meta, которые позже были удалены. Ричард Лин, руководитель отдела открытых исходных кодов 01.AI, позже заявил, что компания вернет эти изменения, и компания приписала Llama 2 часть архитектуры для Yi-34B. Как и все ведущие языковые модели, 01.AI основана на архитектуре "трансформер", впервые разработанной исследователями Google в 2017 году, и китайская компания взяла этот компонент из Llama 2. Анита Хуанг, представитель 01.AI, сообщила, что эксперт по правовым вопросам, с которым консультировалась компания, сказал, что Yi-34B не подпадает под действие лицензии Llama 2. Meta не ответила на просьбу о комментарии.

Каким бы ни был уровень заимствования Yi-34B у Llama 2, китайская модель функционирует совершенно иначе из-за данных, которыми ее снабдили. "Yi разделяет архитектуру Llama', но ее обучение совершенно иное - и значительно лучше", - говорит Эрик Хартфорд, исследователь ИИ из Abacus.AI, который следит за проектами ИИ с открытым исходным кодом. "Они совершенно разные".

Связь с Llama 2 компании Meta - пример того, что, несмотря на уверенность Ли в компетентности китайского ИИ, в настоящее время он следует за Америкой в области генеративного ИИ. Джеффри Динг, доцент Университета Джорджа Вашингтона, изучающий китайскую сцену ИИ, говорит, что, хотя китайские исследователи выпустили десятки больших языковых моделей, в целом отрасль все еще отстает от США.

"Западные компании получили значительное преимущество в разработке больших языковых моделей, потому что они могли использовать публичные релизы для тестирования проблем, получения отзывов пользователей и создания интереса к новым моделям", - говорит он. Выступая на Всемирном экономическом форуме в Давосе на прошлой неделе, Ли утверждал - возможно, надеясь, что эта мысль дойдет до него, - что открытый подход будет иметь решающее значение для любой страны, чтобы в полной мере использовать преимущества ИИ.

"Одна из проблем, связанных с тем, что одна или несколько компаний обладают всей полнотой власти и доминируют над моделями, заключается в том, что это создает огромное неравенство, и не только среди людей, которые менее богаты, и менее богатых стран, но и среди профессоров-исследователей, студентов, предпринимателей, любителей", - сказал Ли. "Если бы не было открытого исходного кода, что бы они делали, чтобы учиться; ведь они могут стать следующими создателями, изобретателями или разработчиками приложений".

Если он прав, технология 01.AI и приложения, созданные на ее основе, поставят китайские технологии в центр следующего этапа развития технологической индустрии.