Какие современные технологии называют искусственным интеллектом и насколько это корректно, рассказал основатель группы компаний EORA.RU Роман Доронин на интернет-форуме «РИФ-Воронеж» в пятницу, 18 октября. Журналист РИА «Воронеж» записала главные тезисы эксперта IT-отрасли.
«При создании ИИ ученые вдохновлялись кино»
– Если мы говорим о первых идеях возникновения искусственного интеллекта, точкой отсчета можно считать 1927 год, когда вышел немецкий фильм «Метрополис». Это авангард фантастического кино, в котором была женщина-киборг, которая во многом послужила прототипом многих подобных созданий. Это феноменальный фильм, и многие известные ученые им вдохновлялись при создании концепций взглядов на будущее, в том числе знаменитый математик Алан Тьюринг. Следующий виток произошел в 1954 году, когда ученые, препарировав кальмара, смогли извлечь нейрон. Это клетка мозга, имеющая такую структуру, благодаря которой в него поступают три связи, нейрон их как-то прочитывает и на выходе выдает одну. Нейрон кальмара был большим, визуально различимым, благодаря чему его смогли исследовать, и тут же появилась идея алгоритмически повторить мозг живого существа, воспроизвести процессы, которые в нем происходят. В тот момент ни к чему прийти не удалось, и наступила так называемая «зима искусственного интеллекта». На «весну искусственного интеллекта» так же повлияли открытия в области математики.
«Машина умеет только то, чему ее научили»
– На самом деле искусственного интеллекта не существует. Более корректный термин – «машинное обучение». Почему мы думаем, что если нейросеть обыграла человека в Dota, значит, завтра она возьмет автомат и пойдет нас всех расстреливать?
В диджитал-эпоху, в которую мы живем, появились модели машинного обучения, которые заточены под свою специфику: какие-то модели – для распознавания лиц, какие-то для генерации новостей, какие-то для предсказания оттока клиентов. Впрочем есть и виды машинного обучения.
«Искусственным интеллектом называют себя разные технологии»
– Сегодня существуют четыре больших технологических направления, каждое из которых перетягивает на себя одеяло искусственного интеллекта. Надо признать, что все они – очень важные и сложные технологически, но все же это не ИИ.
Первое – Data Science. Набор методов и подходов по работе с данными, выявлению закономерностей среди них и их интерпретации. Data Scientist – самая модная профессия последней пары лет. На технологиях Data Science построены банковские системы, рекомендательные системы, банковский скоринг, системы, которые занимаются различными предсказаниями в привязке ко времени. Когда о вас знают какую-то информацию, можно научить машину вам что-то предлагать, основываясь на этой информации. На этом строятся все рекомендательные сервисы.
Вторая сфера – «машинный слух». Это механизм работы человеческого уха, перенесенный в формат машины. С помощью этих технологий можно определять траекторию движения объектов, ориентироваться в пространстве, классифицировать и идентифицировать звуки. Это самая недооцененная технология, по нашему мнению.
Третья технология, которая называет себя ИИ, – это процессинг естественного языка, по-английски – natural language processing, или NLP. Он работает так. Вы говорите: «Алиса, разбуди меня завтра утром». В этот момент ваш голос с помощью нейронных сетей переводится в текст. Дальше NLP обрабатывают и расшифровывают этот текст. «Разбуди» относится к сущности функции – будильнику, «завтра» и «утро» – это сущности времени. Обдумав это предложение, система ответит: «Хорошо, будильник на десять часов утра такого-то дня поставлен». То есть NLP – это перевод с человеческого языка на машинную команду. На этой технологии построены примерно все чат-боты, ассистенты и поисковые системы.
Четвертый тренд – самый всеобъемлющий, интересный и большой – это машинное зрение. Задач, которые решает эта технология, очень много, от биометрии до составления масок для соцсетей. Компьютерное зрение умеет классифицировать объекты – например, отличить кошку от телевизора, а телевизор – от самолета. Затем распознавать их. Например, распознавание лиц использует две модели: одна нейросеть обучена только искать лица и отличать их от всего остального, вторая получает готовые лица и пытается замерить их разность.
Все эти технологии существовали давно, но сейчас стал популярен подход, который называется машинное обучение. Это набор алгоритмов способный обучаться на примерах и выявлять закономерности в данных. Если раньше все просто программировали, то новые алгоритмы основываются на зависимостях, которые они находят.
«Искусственный интеллект мифологизирован»
– Искусственный интеллект – это сфера, которая сильно мифологизирована. По сути, она никак не описана, и все используют этот термин как хотят. В этом году в тренде умные колонки. Уже известно, что к концу года будет минимум семь разных голосовых помощников. Второй тренд – это компьютерное зрение, которое будет развиваться и позволит, например, распознавать вес свиньи, пока она бежит. Но самое страшное – это DeepFake, которого боюсь даже я.
Мой главный тезис в том, что не будет жуткой машины-терминатора, которая всех убьет. Будет скорее очень много странных социальных явлений. Технология DeepFake встраивает любое лицо в любой видеоряд. И это страшно, потому что генерировать таким образом можно и аудио, и видео, и тексты, и если какие-нибудь СМИ будут использовать такой сгенерированный контент, не проверив, это будет полный скандал. Поэтому это самая опасная тема, причем зародилась она не у военных, а в социальных сетях.
Что машины могут, а что – нет
– Машины прекрасно запоминают и воспроизводят. Только человек учит машину, причем для очень локальной задачи. Голосовой ассистент не может помочь сделать задание для TOEFL, потому что для него это слишком сложно, его этому не учили.
Машина не может резко поумнеть и выйти за рамки задачи. Система, которая разговаривает, умеет только разговаривать. Система, которая определяет вес свиньи во время бега, умеет только это. Они не могут обсудить с вами: «Знаешь, вчера 5 тыс. свиней оценил… так устал, видеть их уже не могу».
Машины не могут создавать принципиально новое. Нейросеть, которая детектирует лица, способна только на это. Даже генеративные нейросети могут генерировать только то, чему их научили. Если мы загрузим в нейросеть гигабайты рэпа, она сможет писать что-то похожее на рэп. Но если человек увидит в этом что-то новое, это будет только его интерпретация. Например, когда мы смотрим на облако и нам кажется, что оно похоже на сердечко, это наше восприятие. Облако ничего для этого не сделало, оно не виновато.
Контекст
Десятый интернет-форум «РИФ-Воронеж» стартовал в Event-Hall сити-парка «Град» в пятницу, 18 октября, и проработает до вечера субботы, 19 октября. В его программу вошли выступления экспертов в сфере соцсетей, диджитал-дизайна, HR, SMM, контекстной рекламы, VR и других отраслей. На фестивальные события зарегистрировались более 4,5 тыс. человек. Вход на все мероприятия бесплатный.