Новая технология Google: не прорыв, но шаг к прорыву

Google объявил о внедрении алгоритма BERT на основе искусственного интеллекта. Мнения о технологии собрал Sobesednik.ru

Google объявил о внедрении алгоритма BERT на основе искусственного интеллекта. Мнения о технологии собрал Sobesednik.ru.

Об «одном из самых больших скачков в истории поиска» недавно заявил интернет-гигант Google. Компания внедряет новый алгоритм на основе искусственного интеллекта, который позволит лучше понимать запросы пользователей. Технология получила название BERT. Система должна анализировать не отдельные слова, а целые куски текста. Уточняется, что она сможет расшифровать запросы, которые «невозможно предвидеть», независимо от того, как они написаны, в какой комбинации расположены слова и какой они длины.

Это достижение стало возможным благодаря исследованию моделей, которые обрабатывают слова по отношению ко всему предложению, вместо того чтобы анализировать их друг за другом. По словам разработчиков, это позволяет учитывать полный контекст запроса и обрабатывать его более естественным образом. Между тем одни эксперты, опрошенные Sobesednik.ru, называют технологию «шагом до осмысленного поведения роботов», а другие называют ее лишь «новым методом дрессировки».

Задача обработки естественного языка (Natural Language Processing — NLP) является прикладным направлением, рассказал директор по продукту Sever.ai Владимир Ли. Технология известна и уже применяется в сфере HR [управления персоналом] для обработки текста звонков, чатов, интервью, а также для оценки резюме, продолжил он. Ее применение позволит улучшить качество обработки текста не только в самом поисковике, но и в других индустриях, инструментах и продуктах.

Сама разработка была создана корпорацией еще в 2018 году как академическая инновация, уточняет Ли. «Так как Google внедрила ее для улучшения результатов поискового запроса первой, можно сказать, что это прорыв, учитывая величину датасетов, которыми они владеют», — заявил эксперт.

По словам AI — бизнес-директора компании «Цифра» Дмитрия Луковкина, эффект от использования BERT по мнению Google настолько значителен, что превосходит возможные риски от внедрения новой технологии в самое сердце технологической компании: «Важно, что Google применяет BERT не просто в каком-то из своих многочисленных продуктов, а допускает его в "святая святых" — свой поиск, то на чем в значительной степени основывается мировой успех». При этом саму технологию как таковую Луковкин скорее не считает прорывом.

Глава технического отдела Polarr Inc Даниил Вершинин добавил, что данный алгоритм сканирует не только слова, вводимые при поиске, но и контекст запроса. Для этого используется искусственный интеллект на основе нейронной сети, который обрабатывает обычные языки.

Сейчас разработка новых алгоритмов машинного обучения является каждодневной практикой не только Google, но и «Яндекса». В день, когда появились новости о внедрении Google нового алгоритма, внешняя пресс-служба «Яндекса» выпустила заявление, в котором напомнила, что «исторически именно алгоритмы машинного обучения обеспечивали качество поиска Яндекса»: «Ещё в 2009 году для ранжирования документов мы начали использовать разработанную в стенах компании технологию Матрикснет. В 2016 году алгоритм Палех впервые начал использовать глубокие нейронные сети для нахождения связей между текстами пользовательских запросов и текстами документов. Это помогает нам справляться даже с особенно сложными задачами поиска — например, находить фильмы по неточным описаниям их сюжетов. В 2017-м году эта технология получила своё развитие в алгоритме Королёв».

«Яндекс» таким же образом начал использовать искусственный интеллект, однако для несколько других целей, обращает внимание Даниил Вершинин: «Если обновление поиска от Google нацелено на общую семантику всего поискового запроса, то "Яндекс" позаботился скорее о самых сложных запросах, состоящих из нескольких частей».

«Нейронные сети для обработки человеческих языков, на которых говорим мы с вами, — это, пожалуй, самая сложная тема в искусственном интеллекте. Когда поисковые гиганты сообщают, что начали интеграцию даже отдельных частей как составляющую поиска — это большой прорыв с технологической точки зрения», — рассказал Вершинин. Притом обычным пользователям разница будет заметна лишь для особых запросов, для которых смысл будет скрываться в предлогах, соединяющих слова, продолжает эксперт: «Например, если раньше запрос "книги для обучения математики взрослым" возвращал книги школьного курса, то после обновления поиск от Google поймет запрос правильнее и покажет в первых результатах книги о математике для взрослых».

Генеральный директор Argumentum Дмитрий Жигалов называет новый алгоритм «относительно тривиальной технической задачкой» и считает, что создание сильного искусственного интеллекта эта технология программистов не приблизила. «BERT — это последовательное совершенствование алгоритма анализа предложения методом натаскивания — да-да, дрессировки, а не обучения — нейросети на более крупных объемах размеченных данных с учетом положения слов в предложении и эмоциональной окраски текста», — заявляет эксперт.

По его словам, ничего принципиально нового этот алгоритм не дает, и выдавать двунаправленный анализ предложения, вместо однонаправленного за революцию не стоит. Жигалов уверен, что реальный скачок в поисковых технологиях произойдет, когда начнется анализ целых абзацев с их композиционными и сюжетными особенностями. По его данным, BERT только предстоит тестирование на корректность такого анализа.

«Применение технологии BERT решает общий спектр задач по совершенствованию систем автоматического перевода, коммуникации роботов и людей в разговорном жанре, а также развитию у роботов способности написания текстов, включая художественные произведения», — продолжает тему системный аналитик управления системной архитектуры компании «Техносерв» Александр Голышко. Затем искусственный интеллект сможет распознавать тональность текста или участвовать в вопросно-ответной дискуссии на равных с человеком, продолжает эксперт, «и тут уже остается один шаг до "осмысленного" поведения роботов при общении с людьми, а заодно и понимания, что именно хочет найти пользователь, задавая вопрос в поисковике».