Генеральный директор Google Сундар Пичаи по-прежнему любит Интернет. Каждое утро он просыпается и читает Techmeme, новостной агрегатор, изобилующий ссылками и доступный только через Интернет. По его словам, веб динамичен и устойчив и по-прежнему может с помощью поисковой системы предоставить любую информацию, которую ищет человек.
И все же веб и его важнейший поисковый слой меняются. Мы все видим, как это происходит: Приложения для социальных сетей, видео короткой формы и генеративный ИИ бросают вызов нашим устаревшим представлениям о том, что значит находить информацию в Интернете. Качественной информации в Интернете. Пичаи тоже это видит. Но у него больше возможностей, чем у других, чтобы направить ее в нужное русло.
То, как Пичаи внедряет Gemini, самую мощную модель ИИ Google, говорит о том, что, хотя он и любит старый добрый веб, его гораздо больше интересует его футуристическая версия. Он должен быть таким: За ним придут чат-боты.
Сегодня Google объявила, что чат-бот Bard, который она запустила для борьбы с ChatGPT от OpenAI, получает новое имя: Gemini, как и модель ИИ, на которой он основан и которая была впервые представлена в декабре. Чатбот Gemini также переходит на мобильные устройства и выходит из "экспериментальной" фазы, приближаясь к всеобщей доступности. У него будет собственное приложение на Android и главное место в приложении поиска Google на iOS. А самая продвинутая версия Gemini будет предлагаться в рамках подписки на Google One за 20 долларов в месяц.
Выпуская самую мощную версию Gemini с платной стенкой, Google наносит прямой удар по быстро развивающемуся сервису ChatGPT и сервису подписки ChatGPT Plus. Пичаи также экспериментирует с новым видением того, что предлагает Google - не заменяя поиск, пока нет, а создавая альтернативу, чтобы посмотреть, что получится.
"Так мы всегда подходили к поиску, в том смысле, что по мере развития поиска, появления мобильных устройств и изменения взаимодействия с пользователями мы адаптировались к этому", - говорит Пичаи, выступая перед запуском Gemini. "В некоторых случаях мы идем впереди пользователей, как, например, в случае с мультимодальным ИИ. Но я хочу гибко смотреть в будущее, потому что в противном случае мы можем ошибиться."
Сенсорная перегрузка
"Мультимодальность" - одна из любимых вещей Пичаи в модели ИИ Gemini - один из элементов, который, как утверждает Google, отличает ее от "внутренностей" ИИ-ассистентов ChatGPT от OpenAI и Copilot от Microsoft, которые также работают на основе технологии OpenAI. Это означает, что Gemini обучался работе с данными в разных форматах - не только с текстом, но и с изображениями, аудио и кодом. В результате готовый модальный помощник свободно владеет всеми этими форматами, и его можно попросить ответить с помощью текста или голоса, а также щелкнуть и поделиться фотографией.
"Так устроен человеческий разум, когда вы постоянно ищете что-то и испытываете настоящее желание подключиться к миру, который вы видите", - восторгается Пичаи, говоря, что он давно хотел добавить эту возможность в технологии Google. "Именно поэтому в Google Search мы добавили мультипоиск, именно поэтому мы сделали Google Lens [для визуального поиска]. А в Gemini, который изначально является мультимодальным, вы можете вводить в него изображения и задавать ему вопросы". Это взгляд в будущее, где он действительно сияет."
Google также параллельно проводит эксперимент с использованием искусственного интеллекта для переделки своего основного поискового интерфейса, запустив генеративный поиск, который выдает ответы в виде чатботов перед привычным списком объявлений и ссылок.
Несколько недель назад компания заявила, что не ожидает "момента включения света", когда генеративный поиск полностью заменит Google Search, каким мы его знаем. Но Google планирует расширить "границы возможного" и подумать о том, "какие варианты использования полезны" и "имеют правильный баланс задержки, качества и фактичности", - сказала тогда Лиз Рид, вице-президент и генеральный менеджер Search. Как и Пичаи, она считает, что пришло время экспериментировать с радикальными альтернативами устоявшейся модели Google.
Пичаи говорит, что сейчас Google сосредоточена на создании правильного опыта генеративного ИИ, но он "открыт к возможностям как платного, так и поддерживаемого рекламой опыта генеративного ИИ". Он отказался сообщить, останется ли платное предложение Gemini полностью свободным от рекламы, но указал на другой продукт Google, в котором можно полностью отказаться от рекламы.
"YouTube был очень хорошим примером этого", - говорит Пичаи, ссылаясь на платный уровень без рекламы, с которым YouTube начал экспериментировать несколько лет назад. "Реклама позволяет нам предоставлять продукты большему числу людей, но будут и случаи подписки, которые позволят людям получить другой опыт". Он добавляет: "Я могу представить себе, как один и тот же пользователь ходит туда-сюда между бесплатным поиском и подпиской Gemini". Другими словами, генеративный поиск будет уже не гарниром к поиску, а основным пунктом меню - пусть и более дорогим.
Советуем соблюдать осторожность
Есть еще одна важная причина, по которой Google может захотеть брать деньги за свои услуги ИИ: Это поможет компенсировать огромные вычислительные затраты, связанные с обучением и запуском большой языковой модели.
"Мы можем прогнозировать на 25 лет вперед - если что-то в нулевой день стоит столько, то сколько будет стоить выполнение той же задачи через год, и так далее?" говорит Пичаи. "Мы учитываем эффективность, которую мы получим в базовых моделях, и затем устанавливаем цену, которая, по нашему мнению, имеет смысл."
Какими бы ни были мотивы Google при продаже подписок на чатботов, технология, которую они предоставляют, должна работать надежно. Пичаи признает, что Google Gemini, даже в продвинутой версии, все еще рискует вызвать галлюцинации, как это сделал Бард или другие приложения генеративного ИИ. "Мы хотим, чтобы люди знали об этом", - говорит Пичаи. "Я думаю, что эта технология полезна для многих людей. Но ее нужно использовать правильно, и у меня все еще есть опасения, что люди будут полагаться на нее".
Пичаи, конечно, говорит, что Google старается уменьшить масштабы феномена "модели, ставшие дикими". Но он также предупреждает, что слово "галлюцинация" следует использовать осторожно, и предполагает, что галлюцинация была как особенностью, так и ошибкой, что является увлекательным ребрендингом дезинформации. Он считает, что технология должна быть основана на фактах, но если их слишком убавить, ваш чатбот быстро станет очень скучным.
По словам Пичаи, опыт генеративного ИИ должен быть "образным". "Как ребенок, который не знает, какие ограничения существуют, когда он что-то воображает". Как в первые дни существования Интернета.