Блог экспериментатора инженера-разработчика: Infanty.
Я пишу how-to статьи на редкие темы или статьи обзоры - для себя и тех кто со мной работает.
Блог существует при поддержке: "Оккупационных сил Марса".

Оглавление

  1. Введение.
  2. Прошлое, настоящее и утопическое будущее.
  3. Текущие состояние отрасли прикладных программ в области ИИ.
  4. Знания по ИИ имевшиеся у меня перед началом проекта в области ИИ.
  5. Сравнение алгоритмов поисковых систем нового поколения.
  6. Нейронная сеть без дополнительных алгоритмов не может быть основой для ИИ.
  7. ПО, алгоритмы и архитектура проекта с использованием AI и BigData (реализация не включена).
  8. Реализация прототипа проекта с использованием AI и BigData (настройка ПО не включено).

 

1. Введение

В годы когда ещё не существовали чат-боты или такие программы как: Siri, Microsoft Cortana, Google Now или Amazon Echo, поступило предложение поучаствовать в качестве архитектора при разработке подобного приложения. На первом этапе разработки - предполагалось, что приложение будет отвечать на вопросы пользователя (как чат-бот) и выполнять несложные действия используя API других программ (по концепции было очень похоже на Siri). На втором этапе разработки - программа должна была отвечать на вопросы по конкретному тексту новости или статьи. А на третьем этапе разработки - предоставлять сокращённый пересказ статьи на одном из нескольких заданных языках. В итоге должна была получиться поисковая система умеющая не просто искать документы на определённых сайтах, но и удалять из выдачи религиозно опасные тексты, давая краткий пересказ любого из оставшихся в поисковой выдаче документов на арабском, берберском, французском или русском языке.

К сожалению огонь войны поглотил страну инвестора проекта и проект был закрыт после создания рабочего прототипа, но до реализации полноценного программного продукта. При этом наработки проекта до сих пор интересны с учётом новой волны популярности машинного обучения (Machine Learning, Deep learning, Natural Language Processing) и робототехники (в том числе и в области: Artificial intelligence).

 

2. Прошлое, настоящее и утопическое будущее

Первым шагом работ стала подготовка исследования о наличии научной базы для разработки подобного программного обеспечения и перспектив развития рынка подобного программного обеспечения на несколько десятилетий вперёд. Ниже - краткое изложение данного исследования дополненное на момент публикации статьи.

Первым в мире компьютером был американский программируемый компьютер, который разработал и построил в 1941 году гарвардский математик Говард Эйксон при сотрудничестве четырёх инженеров компании IBM, по заказу которой компьютер и разрабатывался. Компьютер был создан на основе идей Чарльза Бэббиджа.

В 1950 году в философском журнале Mind был описан тест Тьюринга — эмпирический тест, идея которого была предложена Аланом Тьюрингом в статье «Вычислительные машины и разум». Тьюринг задался целью определить, может ли машина мыслить.

В 1956 году, на Дартмундской летней конференции, Рей Соломонофф написал отчёт о вероятностной машине, обучающейся без учителя, назвав её: «Индуктивная машина вывода».

В СССР большой в клад в развитие искусственного интеллекта внёс Д.А. Поспелов, который с 1968 г. занялся исследованиями в этой области. Им был впервые в мире разработан подход к принятию решений, опирающийся на семиотические (логико-лингвистические) модели, который послужил теоретической основой ситуационного управления большими системами. Он создал теорию "наивных" псевдофизических логик, моделирующих рассуждения "здравого смысла" о времени, пространстве, действиях, каузальных цепочках и т.д., которая обеспечивает реализацию в интеллектуальных системах рассуждений о закономерностях физического мира и действиях в нем. Д.А. Поспелов предложил формальную модель поступков, описывающую нормативное поведение, что позволяет роботам и другим системам искусственного интеллекта принимать решения - целесообразные с точки зрения норм.

В 2006 году, Дэвид Феруччи, старший менеджер отделения IBM по семантическому анализу, занялся тестированием одного из самых мощных суперкомпьютеров компании, занимавшего одну из верхних строчек 500 самых производительных машин мира. Феруччи решил попробовать, насколько эффективно машина будет справляться с задачами, поставленными "естественным языком", и предложил ей ответить на 500 вопросов, заданных в уже состоявшихся программах "Jeopardy!". Результаты оказались катастрофическими: по сравнению с живыми игроками, машина недостаточно быстро была готова к ответу и количество правильных ответов не превышало 15%. В 2007 году он смог убедить руководство IBM дать ему команду из 15 человек и от 3 до 5 лет на создание эффективной автоматической системы, способной отвечать на не формализованные вопросы.

5 июня 2014 года в Токио впервые был продемонстрирован человекоподобный робот Pepper. Он оснащен микрофоном, 2 HD-камерами и 3D-датчиками, которые могут распознавать человеческую мимику и реагировать на неё. Робот запрограммирован адаптироваться к окружающей обстановке, на общение с людьми, в процессе которого, помимо мимики, он способен анализировать жесты и тон голоса собеседника. Для распознания эмоций и общения с пользователями на естественном языке робот использует вопросно-ответную систему искусственного интеллекта суперкомпьютера IBM Watson.

25 ноября 2016 года - физики из Университета Бристоля в Великобритании рассказали про концепцию "вечной" батареи на основе алмаза из радиоактивного изотопа углерода-14.

Теоретически лишь небольшой промежуток времени отделяет человечество от того, что бы всю не творческую работу делали человекоподобные роботы с искусственным интеллектом, а человечество занималась творчеством и покорением новых планет как в романах "Час Быка" и "Туманность Андромеды" Ивана Ефремова.

Практически же, это возможно будет и не достижимо так как при таком общественном строе станут не нужны супер-корпорации, государства и правительства, а часть народа вымрет погрязнув в излишествах или же отвергнет прогресс и станет жить как жили их предки сотни лет назад.

С другой стороны построить робота с искусственным интеллектом и похожим на человека как внешне, так и по поступкам можно уже сегодня. Но совершенствовать такое "устройство" стирая грани между ним и человеком - можно бесконечное количество времени: разрабатывая как новые материалы и механические части "устройства", так и работая над алгоритмами его поведения.

 

3. Текущие состояние отрасли прикладных программ в области ИИ

После этого был произведён анализ текущих возможных ниш для развития проекта помимо основного функционала для дальнейшего развития проекта и оценка перспектив рынка (в том числе и инвестиционных) в данный момент. Ниже - краткое изложение данного исследования обновлённое на момент публикации статьи.

В современном мире программы с искусственным интеллектом окружают нас. Может он и не выражен в них настолько, чтоб мы его замечали, но он значительно облегчает нам жизнь. Это и голосовой помощник Siri в нашем телефоне, это и системы умного дома и робот пылесос, это и дорожная камера регистрирующая нарушения правил дорожного движения и система круиз-контроля в автомобиле, а так же всевозможные экспертные системы прогнозирования рисков помогающие принимать управленческие решения. Текущие программы использующие в своей работе искусственный интеллект - можно разделить на несколько групп:

  • Группа программ работающих с доказательством теорем. Много неформальных задач, например: медицинская диагностика, применяют при решении методические подходы, которые использовались при автоматизации доказательства теорем. Поиск доказательства математической теоремы требует не только провести дедукцию, исходя из гипотез, но также создать интуитивные предположения о том, какие промежуточные утверждение следует доказать для общего доказательства основной теоремы.

  • Группа программ работающих с распознаванием изображений. Применение искусственного интеллекта для распознавании образов позволила создавать практически работающие системы идентификации графических объектов на основе аналогичных признаков. В качестве признаков могут рассматриваться любые характеристики объектов, подлежащих распознаванию.

  • Группа программ работающих с машинным переводом и пониманием человеческой речи. Задача анализа предложений человеческой речи с применением словаря является типичной задачей систем искусственного интеллекта. Для ее решения был создан язык-посредник, облегчающий сопоставление фраз из разных языков. В дальнейшем этот язык-посредник превратилась в семантическую модель представления значений текстов, подлежащих переводу. Эволюция семантической модели привела к созданию языка для внутреннего представления знаний. В результате, современные системы осуществляют анализ текстов и фраз в четыре основных этапа: морфологический анализ, синтаксический, семантический и прагматический анализ.

  • Игровые программы. В основу большинства игровых программ положены несколько базовых идей искусственного интеллекта, таких как перебор вариантов и самообучения. Одна из наиболее интересных задач в сфере игровых программ, использующих методы искусственного интеллекта, заключается в обучении компьютера игры в шахматы. Она была основана еще на заре вычислительной техники, в конце 50-х годов.

  • Группа программ способных создавать музыку, стихи, рассказы, статьи, дипломы и даже диссертации. Но данное машинное творчество строится на объединении более мелких алгоритмов и данных в цепочки более крупных алгоритмов, то есть на самом деле не является аналогом "человеческого" творчества когда человек может нарисовать эскиз самолёта похожего на стрекозу для фантастического фильма (программа нарисует или металлическую стрекозу или самолёт с крыльями от стрекозы).

  • Экспертные системы. Методы искусственного интеллекта нашли применение в создании автоматизированных консультирующих систем или экспертных систем. Первые экспертные системы были разработаны, как научно-исследовательские инструментальные средства в 1960-х годах прошлого столетия. Они были системами искусственного интеллекта, специально предназначенными для решения сложных задач в узкой предметной области, такой, например, как медицинская диагностика заболеваний.

В текущий момент бум на AI-стартапы, меняющих правила игры и рынок, которые можно так же разбить на группы:

  • Распознавания голоса, например для персонального ассистента.
  • Сбора и обработке текстов на нескольких языках, например: для систем машинного перевода в реальном времени.
  • Самообучающихся программ с шаблонами автоматических ответов для ботов, почтовых программ (персональный ассистент) и т.п. на 161 языке.
  • Сервисов для разворачивания приватных облачных AI-сервисов и сервисов моделирования, например для компьютерного моделирования в в аграрной, добывающей или торговой отрасли.
  • Программ с искусственным интеллектом для мобильных приложений, например: банковские персональные ассистенты, ассистенты врачей и т.п.
  • Программ определяющих пол, возраст, эмоций и т.п. по фотографии или тексту отзыва пользователя в социальной сети.
  • Сервисы machine-learning для внедрения в облачные продукты других разработчиков.

Как можно заметить, указанные выше группы AI-стартапов решают прикладные задачи, а не занимаются фундаментальной исследовательской деятельностью.

На изображении ниже, можно увидеть ключевые поглощения и инвестиции в подобные AI-стартапы за последние три года.