Автор
Владимир Максимов
Исследование НИУ ВШЭ выявило, что лучше всего в российском бизнесе прижились четыре ИИ-технологии: интеллектуальный анализ данных, обработка естественного языка, компьютерное зрение и распознавание и синтез речи.
В 2021 году Институт статистических исследований и экономики знаний НИУ ВШЭ изучил, насколько широко российский бизнес внедряет искусственный интеллект (ИИ). Оказалось, что только 5,4% наших компаний применяют подобные решения. В чем проблема? Искусственный интеллект не востребован или эти технологии во многом остаются продуктом всеобщего хайпа и пока не могут заменить людей? Отчасти обе версии верны, но особенно — вторая.
Исследование НИУ ВШЭ выявило, что лучше всего в российском бизнесе прижились четыре ИИ-технологии: интеллектуальный анализ данных, обработка естественного языка, компьютерное зрение и распознавание и синтез речи.
Интеллектуальный анализ данных
Исследование показало, что интеллектуальный анализ данных — одна из двух самых популярных технологий ИИ в российском бизнесе (ее используют 3,8% компаний). Как правило, такому ИИ не нужно сложное оборудование, а достаточно готовой базы данных.
Как это работает, можно понять на примере из практики Toshiba. Там разработали и внедрили систему, которая анализирует данные медицинских осмотров сотрудников, принимаемые ими лекарства, образ жизни, биологические параметры. Обработав эту информацию, нейросеть прогнозирует для каждого из них продолжительность здоровой жизни и риск заболеваний (диабет, болезни почек, печени, гипертония и т. п.), а также рекомендации по лечению. Точность прогноза — 96%.
Однако ИИ не всегда может посмотреть на ситуацию под необычным углом. Скажем, в одном из госпиталей США ИИ-доктор реже рекомендовал лечение чернокожим пациентам, чем белым. Выяснилось, что он изучал статистику обращений, не учитывая, что у первых из-за финансового неблагополучия реже имеются страховки, чем у вторых. Такие ошибки еще долго будут сопровождать интеллектуальный анализ данных, потому что ИИ не способен мыслить фундаментально.
Обработка естественного языка
По данным НИУ ВШЭ, это вторая популярная технология (применяется в 3,8% компаний). В данном направлении прогресс действительно быстрый, поскольку во многом определяется объемами текстов, которые можно «скормить» машине. Первая версия алгоритма GPT была обучена на 117 млн параметров, а последняя (GPT-3) — на 175 млрд. GPT может притвориться исторической личностью, предложить осмысленное завершение фразы и даже сделать макет сайта по его описанию. Нейросеть «ВКонтакте» умеет делать тезисную выжимку из текстов, есть ИИ-решения, которые придумывают заголовки и пишут короткие новости. Но сгенерировать полноценный текст, который имел бы идею, аргументацию и вывод, нейросети пока не могут.
Кроме того, машины не скоро заменят авторов потому, что в отличие от человека не всегда понимают контекст, стилистику, коннотации. Наконец, машины делают ошибки из-за самой базы текстов, на которой они учатся, ведь в этот корпус нередко попадают ошибочные, антинаучные, непристойные тексты и сообщения, которые машина может воспроизвести. Как, скажем, бот Twitter по имени Tay, который внезапно начал оскорблять пользователей расистскими высказываниями.
Компьютерное зрение
Это третье по популярности решение на основе ИИ в России – его используют 3,7% компаний. Наиболее очевидные успехи здесь достигнуты в системах безопасности, основанных на распознавании лиц: сейчас от них не скрыться даже за медицинской маской. Если первые нейросети вглядывались в 14 ключевых точек на лице, то сейчас, к примеру, китайская SenseTime считывает 240 точек вокруг носа, глаз, рта, что помогает ей с точностью до 90% идентифицировать человека в очках, с бородой или усами, в маске, шляпе, платке и т. п.
Более того, искусственный интеллект умеет сам создавать изображения: фотографии несуществующих людей, картины, 3D-персонажей. То есть в определенной степени уже может заменить, скажем, фоторедактора. Но создавать визуальный контент по сложному заказу — нет. Здесь он уступает человеку в той особенности, которая обычно считается слабой стороной Homo sapiens, а именно в субъективности и стереотипном мышлении. Нейросесть «Николай Иронов» от компании «Студия Артемия Лебедева» может сконструировать логотип по заказу, но «живой» дизайнер, прежде чем приступить к работе, может по внешности заказчика, его стилю и манере говорить почувствовать на интуитивном уровне, какой результат ему понравится, а какой нет. Нейросети пока это недоступно.
Распознавание речи
Порядка 3,6% компаний в России применяют ИИ в распознавании и синтезе речи. Многие из нас уже пользуются персональными ассистентами, которые реагируют на голосовые команды: Сири, Кортана, Алиса, Алекса. А их разнообразные профессиональные собратья уже отвечают на звонки клиентов банков и страховых компаний и даже проводят предварительные собеседования.
Но проблема с ИИ в этой сфере состоит в том, что голосовой помощник наследует ограниченность той базы звукового контента, на которой учится. Исследование, проведенное в США, показало, что голосовой помощник Google на 13% лучше понимает мужчин, чем женщин. Для решения повседневных задач это не так страшно, но что, если судьбу человека определяет робот-эйчар? Очевидно, что без «живого» вмешательства не будут решаться многие задачи коммуникации через устную речь.
Восстанут ли машины?
В ближайшие десятилетия искусственный интеллект, безусловно, станет частью бизнеса. Всё то же исследование НИУ ВШЭ показало, что в России, несмотря на низкую долю внедрения ИИ в целом, 36% крупных компаний (с 10 тыс. работников и более) используют такие технологии. То есть во многом вопрос их более широкого применения и развития— финансовый. Однако главное техническое препятствие заключается в том, что ИИ всё равно еще долго не будет думать как человек, ведь на наши решения влияет куда больше факторов, чем мы пока способны «загрузить» в компьютер. А значит, восстания машин не произойдет, но машины прочно займут позицию наших повседневных помощников.