Всемирный Клубъ-Музей-Лекторий "Традиционные Маски и Фигуры мира"

Академические среды

Что такое нейронные сети и как они работают? Классификация искусственных нейросетей

Нейронная сеть – одно из направлений искусственного интеллекта, цель которого смоделировать аналитические механизмы, осуществляемые человеческим мозгом. Задачи, которые решает типичная нейросеть – классификация, предсказание и распознавание. Нейросети способны самостоятельно обучаться и развиваться, строя свой опыт на совершенных ошибках.

Нейросети — это последовательность нейронов, соединенных между собой синапсами. Структура нейронной сети пришла в мир программирования прямиком из биологии. Благодаря такой структуре, машина обретает способность анализировать и даже запоминать различную информацию. Также нейронные сети способны не только анализировать входящую информацию, но и воспроизводить ее из своей памяти.

Другими словами, нейросеть это машинная интерпретация мозга человека, в котором находятся миллионы нейронов передающих информацию в виде электрических импульсов.

История создания нейронных сетей

Какова же история развития нейронных сетей в науке и технике? Она берет свое начало с появлением первых компьютеров или ЭВМ (электронно-вычислительная машина) как их называли в те времена. Так еще в конце 1940-х годов некто Дональд Хебб разработал механизм нейронной сети, чем заложил правила обучения ЭВМ, этих «протокомпьютеров».

Дальнейшая хронология событий была следующей:

  • В 1954 году происходит первое практическое использование нейронных сетей в работе ЭВМ.
  • В 1958 году Франком Розенблатом разработан алгоритм распознавания образов и математическая аннотация к нему.
  • В 1960-х годах интерес к разработке нейронных сетей несколько угас из-за слабых мощностей компьютеров того времени.
  • И снова возродился уже в 1980-х годах, именно в этот период появляется система с механизмом обратной связи, разрабатываются алгоритмы самообучения.
  • К 2000 году мощности компьютеров выросли настолько, что смогли воплотить самые смелые мечты ученых прошлого. В это время появляются программы распознавания голоса, компьютерного зрения и многое другое.

Как работают нейронные сети?

Искусственная нейронная сеть — совокупность нейронов, взаимодействующих друг с другом. Они способны принимать, обрабатывать и создавать данные. Это настолько же сложно представить, как и работу человеческого мозга. Нейронная сеть в нашем мозгу работает для того, чтобы вы сейчас могли это прочитать: наши нейроны распознают буквы и складывают их в слова.

Нейронная сеть включает в себя несколько слоёв нейронов, каждый из которых отвечает за распознавание конкретного критерия: формы, цвета, размера, текстуры, звука, громкости и т.д.

Год от года в результате миллионов экспериментов и тонн вычислений к простейшей сети добавлялись новые и новые слои нейронов. Они работают по очереди. Например, первый определяет, квадрат или не квадрат, второй понимает, квадрат красный или нет, третий вычисляет размер квадрата и так далее. Не квадраты, не красные и неподходящего размера фигуры попадают в новые группы нейронов и исследуются уже ими.

Для чего нужны нейросети?

Нейронные сети используются для решения сложных задач, которые требуют аналитических вычислений подобных тем, что делает человеческий мозг. Самыми распространенными применениями нейронных сетей является:

  • Классификация — распределение данных по параметрам. Например, на вход дается набор людей и нужно решить, кому из них давать кредит, а кому нет. Эту работу может сделать нейронная сеть, анализируя такую информацию как: возраст, платежеспособность, кредитная история и тд.
  • Предсказание — возможность предсказывать следующий шаг. Например, рост или падение акций, основываясь на ситуации на фондовом рынке.
  • Распознавание — в настоящее время, самое широкое применение нейронных сетей. Используется в Google, когда вы ищете фото или в камерах телефонов, когда оно определяет положение вашего лица и выделяет его и многое другое.

Область применения искусственных нейронных сетей с каждым годом все более расширяется, на сегодняшний день они используются в таких сферах как:

  • Машинное обучение (machine learning), представляющее собой разновидность искусственного интеллекта. В основе его лежит обучение ИИ на примере миллионов однотипных задач. В наше время машинное обучение активно внедряют поисковые системы Гугл, Яндекс, Бинг, Байду. Так на основе миллионов поисковых запросов, которые все мы каждый день вводим в Гугле, их алгоритмы учатся показывать нам наиболее релевантную выдачу, чтобы мы могли найти именно то, что ищем.
  • В роботехнике нейронные сети используются в выработке многочисленных алгоритмов для железных «мозгов» роботов.
  • Архитекторы компьютерных систем пользуются нейронными сетями для решения проблемы параллельных вычислений.
  • С помощью нейронных сетей математики могут разрешать разные сложные математические задачи.

Теперь, чтобы понять, как же работают нейронные сети, давайте взглянем на ее составляющие и их параметры.

Что такое нейрон?

Нейрон — это вычислительная единица, которая получает информацию, производит над ней простые вычисления и передает ее дальше. Они делятся на три основных типа: входной (синий), скрытый (красный) и выходной (зеленый):

Также есть нейрон смещения и контекстный нейрон. В том случае, когда нейросеть состоит из большого количества нейронов, вводят термин слоя. Соответственно, есть входной слой, который получает информацию, n скрытых слоев (обычно их не больше 3), которые ее обрабатывают и выходной слой, который выводит результат.

У каждого из нейронов есть 2 основных параметра:

  • входные данные (input data),
  • выходные данные (output data).

В случае входного нейрона: input=output. В остальных, в поле input попадает суммарная информация всех нейронов с предыдущего слоя, после чего, она нормализуется, с помощью функции активации (пока что просто представим ее f(x)) и попадает в поле output.

Важно помнить, что нейроны оперируют числами в диапазоне [0,1] или [-1,1]. А как же, вы спросите, тогда обрабатывать числа, которые выходят из данного диапазона? На данном этапе, самый простой ответ — это разделить 1 на это число. Этот процесс называется нормализацией, и он очень часто используется в нейронных сетях. Подробнее об этом чуть позже.

Что такое синапс?

Синапс это связь между двумя нейронами. У синапсов есть 1 параметр — вес. Благодаря ему, входная информация изменяется, когда передается от одного нейрона к другому. Допустим, есть 3 нейрона, которые передают информацию следующему. Тогда у нас есть 3 веса, соответствующие каждому из этих нейронов. У того нейрона, у которого вес будет больше, та информация и будет доминирующей в следующем нейроне (пример — смешение цветов).

На самом деле, совокупность весов нейронной сети или матрица весов — это своеобразный мозг всей системы. Именно благодаря этим весам, входная информация обрабатывается и превращается в результат.

Важно помнить, что во время инициализации нейронной сети, веса расставляются в случайном порядке.

Биологическая основа нейросвязей

В нашем мозге есть нейроны. Их около 86 миллиардов. Нейрон это клетка, соединенная с другими такими клетками. Клетки соединены друг с другом отростками. Всё это вместе напоминает своего рода сеть. Вот вам и нейронная сеть. Каждая клетка получает сигналы от других клеток. Далее обрабатывает их и сама отправляет сигнал другим клеткам.

Проще говоря нейрон получает сигнал (информацию), обрабатывает его (что то там решает, думает) и отправляет свой ответ дальше. Стрелки изображают связи-отростки по которым передается информация:

Вот так передавая друг другу сигналы, нейронная сеть приходит к какому либо решению. А мы то думали, что мы единолично все решаем! Нет, наше решение — это результат коллективной работы миллиарда нейронов.

На моей картинке стрелки обозначают связи нейронов. Связи бывают разные. Например стрелка внизу между нейроном 2 и 5 длинная. И значит сигнал от нейрона 2 до нейрона 5 будет дольше идти, чем например сигнал от нейрона 3 где стрелка вдвое короче. Да и вообще сигнал может затухнуть и прийти слабым. В биологии много всего интересного.

Но рассматривать всё это — как там думает нейрон, затухнет ли сигнал, когда он придет или не придет в IT не стали. А что голову морочить? И просто построили упрощенную модель.

В этой модели можно выделить две основные составляющие:

  • Алгоритм. В биологии нейрон думает. В программировании «думанье» заменяется алгоритмом — то есть набором команд. Например — если на вход пришла 1 отправь 0. Вот и все «мозги» нашего нейрона.
  • Вес решения. Все связи, затухания и т.д. решили заменить «весом». Вес это как сила решения, его важность. Это просто величина, чаще число. Нашему нейрону приходит решение с определенным весом, нашему нейрону приходит число. И если оно больше другого пришедшего числа то оно важнее. Это как пример.

Итого: есть алгоритм и есть вес решения. Это всё что нужно для построения простейшей нейросети.

Искусственная нейронная сеть

Нейронная сеть — попытка с помощью математических моделей воспроизвести работу человеческого мозга для создания машин, обладающих искусственным интеллектом.

Искусственная нейронная сеть обычно обучается с учителем. Это означает наличие обучающего набора (датасета), который содержит примеры с истинными значениями: тегами, классами, показателями.

Например, если вы хотите создать нейросеть для оценки тональности текста, датасетом будет список предложений с соответствующими каждому эмоциональными оценками. Тональность текста определяют признаки (слова, фразы, структура предложения), которые придают негативную или позитивную окраску. Веса признаков в итоговой оценке тональности текста (позитивный, негативный, нейтральный) зависят от математической функции, которая вычисляется во время обучения нейронной сети.

Раньше люди генерировали признаки вручную. Чем больше признаков и точнее подобраны веса, тем точнее ответ. Нейронная сеть автоматизировала этот процесс:

Искусственная нейронная сеть состоит из трех компонентов:

  • Входной слой;
  • Скрытые (вычислительные) слои;
  • Выходной слой.

Обучение таких нейросетей происходит в два этапа:

  • Прямое распространение ошибки;
  • Обратное распространение ошибки.

Во время прямого распространения ошибки делается предсказание ответа. При обратном распространении ошибка между фактическим ответом и предсказанным минимизируется.

Для более глубокого изучения советуем к просмотру 2 видео из TED Talks: Видео 1Видео 2 (видео-ролики на английском языке).

Виды и классификация нейронных сетей

За период развития, нейронные сети поделились на множество типов, которые переплетаются между собой в различных задачах. На данный момент сложно классифицировать какую-либо сеть только по одному признаку. Это можно сделать по принципу применения, типу входной информации, характеру обучения, характеру связей, сфере применения. 

Нейронная сеть

Принцип применения

Обучение с учителем (+) или без(-) или смешанное (с)

Сфера применения

Перцептрон Розенблатта

Распознание образов, принятие решений, прогнозирование, аппроксимация, анализ данных

+

Практически любая сфера применения, кроме оптимизации информации

Хопфилда

Сжатие данных и ассоциативная память

Строение компьютерных систем

Кохонена

Кластеризация, сжатие данных, анализ данных, оптимизация

Финансы, базы данных

Радиально-базисных функций (RBF-сеть)

Принятие решений и управление, аппроксимация, прогнозирование

с

Управленческие структуры, нейроуправление

Свёрточная

Распознание образов

+

Обработка графических данных

Импульсная

Принятие решение, распознавание образов, анализ данных

с

Протезирование, робототехника, телекоммуникации, компьютерное зрение

Про то, что такое обучение с учителем, написано в следующем разделе. Каждая сеть имеет свои характеристики, которые можно применять в том или ином случае. Рассмотрим более подробно два типа сетей, которые для множества производных типов нейросетей являются практически первоисточниками.

Сверточные

Один из популярнейших типов сети, часто используемый для распознавания той или иной информации в фотографиях и видео, обработке языка, системах для рекомендаций.

Основные характеристики: 

  • Отличная масштабируемость – проводят распознания образов любого разрешения (какое бы не было оно большое).
  • Использование объемных трехмерных нейронов – внутри слоя, нейроны связаны малым полем, именуемы рецептивным слоем.
  • Механизм пространственной локализации – соседние слои нейронов связаны таким механизмом, за счет чего обеспечивается работа нелинейных фильтров и охват все большего числа пикселей графического изображения.

Идея сложной системы этого типа нейросети возникла при тщательном изучении зрительной коры, которая в больших полушариях мозга отвечает за обработку визуальной составляющей. Основной критерий выбора в пользу сверточного типа – она в составе технологий глубокого обучения. Схожий тип с перцептроном, но разница в том, что здесь используется ограниченная матрица весов, сдвигаемая по обрабатываемому слою, вместо полносвязной нейронной сети.

Рекуррентные

Этот тип нейросети, в котором связи между элементами могут обрабатывать серии различных событий во времени или работать с последовательными цепочками в пространстве. Такой тип часто применяют там, где что-то целое разбито на куски. Например, распознавание речи или рукописного текста. От нее пошло множество видов сетей, в том числе Хопфилда, Элмана и Джордана.

Обучение нейронной сети

Один из главных и самый важный критерий – возможность обучения нейросети. В целом, нейросеть – это совокупность нейронов, через которые проходит сигнал. Если подать его на вход, то пройдя через тысячи нейронов, на выходе получится неизвестно что. Для преобразования нужно менять параметры сети, чтобы на выходе получились нужные результаты.

Входной сигнал изменить нельзя, сумматор выполняет функцию суммирования и изменить что-то в нем или вывести из системы не выйдет, так как это перестанет быть нейросетью. Остается одно – использовать коэффициенты или коррелирующие функции и применять их на веса связей. В этом случае можно дать определение обучения нейронной сети – это поиск набора весовых коэффициентов, которые при прохождении через сумматор позволят получить на выходе нужный сигнал.

Такую концепцию применяет и наш мозг. Вместо весов в нем используются синопсы, позволяющие усиливать или делать затухание входного сигнала. Человек обучается, благодаря изменению синапсов при прохождении электрохимического импульса в нейросети головного мозга.

Но есть один нюанс. Если же задать вручную коэффициенты весов, то нейросеть запомнит правильный выходной сигнал. При этом вывод информации будет мгновенным и может показаться, что нейросеть смогла быстро обучиться. И стоит немного изменить входной сигнал, как на выходе появятся неправильные, не логические ответы.

Поэтому, вместо указания конкретных коэффициентов для одного входного сигнала, можно создать обобщающие параметры с помощью выборки.

С помощью такой выборки можно обучать сеть, чтобы она выдавала корректные результаты. В этом моменте, можно поделить обучение нейросети на обучение с учителем и без учителя.

Обучение с учителем

Обучение таким способом подразумевает концепцию: даете выборку входных сигналов нейросети, получаете выходные и сравниваете с готовым решением.

Как готовить такие выборки:

  • Для опознавания лиц создать выборку из 5000-10000 фотографий (вход) и самостоятельно указать, какие содержат лица людей (выход, правильный сигнал).
  • Для прогнозирования роста или падения акций, выборка делается с помощью анализа данных прошлых десятилетий. Входными сигналами могут быть как состояние рынка в целом, так и конкретные дни.

Учителем не обязательно выступает человек. Сеть нужно тренировать сотнями и тысячами часов, поэтому в 99% случаев тренировкой занимается компьютерная программа.

Обучение без учителя

Концепция состоит в том, что делается выборка входных сигналов, но правильных ответов на выходе вы знать не можете.

Как происходит обучение? В теории и на практике, нейросеть начинает кластеризацию, то есть определяет классы подаваемых входных сигналов. Затем, она выдает сигналы различных типов, отвечающие за входные объекты.

Сверточная нейронная сеть

Свёрточная нейронная сеть (СНС, CNN) — специальная архитектура искусственных нейронных сетей, предложенная Яном Лекуном и нацеленная на эффективное распознавание образов. Данной архитектуре удаётся гораздо точнее распознавать объекты на изображениях, так как, в отличие от многослойного персептрона, учитывается двухмерная топология изображения. При этом свёрточные сети устойчивы к небольшим смещениям, изменениям масштаба и поворотам объектов на входных изображениях. Во многом, именно поэтому архитектуры, основанные на свёрточных сетях, до сих пор занимают первые места в соревнованиях по распознаванию образов, как, например, ImageNet.

Сверточная нейронная сеть является основным инструментом для классификации и распознавания объектов, лиц на фотографиях, распознавания речи. Есть множество вариантов применения CNN, такие как Deep Convolutional Neural Network (DCNN),  Region-CNN (R-CNN), Fully Convolutional Neural Networks (FCNN), Mask R-CNN и другие.

CNN на сегодня – “рабочая лошадка” в области нейронных сетей. Используется преимущественно для решения задач компьютерного зрения, хотя может применяться также для работы с аудио и любыми данными, которые можно представить в виде матриц.

Особенности работы свёрточных сетей

Нам известно, что нейронные сети хороши в распознавании изображений. Причём хорошая точность достигается и обычными сетями прямого распространения, однако, когда речь заходит про обработку изображений с большим числом пикселей, то число параметров для нейронной сети многократно увеличивается. Причём настолько, что время, затрачиваемое на их обучение, становится невообразимо большим.

Так, если требуется работать с цветными изображениями размером 64х64, то для каждого нейрона первого слоя полносвязной сети потребуется 64·64·3 = 12288 параметров, а если сеть должна распознавать изображения 1000х1000, то входных параметров будет уже 3 млн! А помимо входного слоя есть и другие слои, на которых, зачастую, число нейронов превышает количество нейронов на входном слое, из-за чего 3 млн запросто превращаются в триллионы! Такое количество параметров просто невозможно рассчитать быстро ввиду недостаточно больших вычислительных мощностей компьютеров.

Главной особенностью свёрточных сетей является то, что они работают именно с изображениями, а потому можно выделить особенности, свойственные именно им. Многослойные персептроны работают с векторами, а потому для них нет никакой разницы, находятся ли какие-то точки рядом или на противоположных концах, так как все точки равнозначны и считаются совершенно одинаковым образом. Изображения же обладают локальной связностью. Например, если речь идёт об изображениях человеческих лиц, то вполне логично ожидать, что точки основных частей лица будут рядом, а не разрозненно располагаться на изображении. Поэтому требовалось найти более эффективные алгоритмы для работы с изображениями и ими оказались свёрточные сети.

В отличие от сетей прямого распространения, которые работают с данными в виде векторов, свёрточные сети работают с изображениями в виде тензоров. Тензоры — это 3D массивы чисел, или, проще говоря, массивы матриц чисел.

Изображения в компьютере представляются в виде пикселей, а каждый пиксель – это значения интенсивности соответствующих каналов. При этом интенсивность каждого из каналов описывается целым числом от 0 до 255.

Чаще всего используются цветные изображения, которые состоят из RGB пикселей – пикселей, содержащих яркости по трём каналам: красному, зелёному и синему. Различные комбинации этих цветов позволяют создать любой из цветов всего спектра. Именно поэтому вполне логично использовать именно тензоры для представления изображений: каждая матрица тензора отвечает за интенсивность своего канала, а совокупность всех матриц описывает всё изображение.

Из чего состоят свёрточные сети?

Свёрточные нейронные сети состоят из базовых блоков, благодаря чему их можно собирать как конструктор, добавляя слой за слоем и получая всё более мощные архитектуры. Основными блоками свёрточных нейронных сетей являются свёрточные слои, слои подвыборки (пулинга), слои активации и полносвязные слои.

Так, например, LeNet5 – одна из первых свёрточных сетей, которая победила в ImageNet, состояла из 7 слоёв: слой свёртки, слой пулинга, ещё один слой свёртки ещё один слой пулинга и трёхслойная полносвязная нейронная сеть.

Сверточный слой

Сверточный слой нейронной сети представляет из себя применение операции свертки к выходам с предыдущего слоя, где веса ядра свертки являются обучаемыми параметрами. Еще один обучаемый вес используется в качестве константного сдвига (англ. bias). При этом есть несколько важных деталей:

  • В одном сверточном слое может быть несколько сверток. В этом случае для каждой свертки на выходе получится своё изображение. Например, если вход имел размерность w×hw×h, а в слое было nn сверток с ядром размерности kx×kykx×ky, то выход будет иметь размерность n×(w−kx+1)×(h−ky+1)n×(w−kx+1)×(h−ky+1);
  • Ядра свертки могут быть трёхмерными. Свертка трехмерного входа с трехмерным ядром происходит аналогично, просто скалярное произведение считается еще и по всем слоям изображения. Например, для усреднения информации о цветах исходного изображения, на первом слое можно использовать свертку размерности 3×w×h3×w×h. На выходе такого слоя будет уже одно изображение (вместо трёх);
  • Можно заметить, что применение операции свертки уменьшает изображение. Также пиксели, которые находятся на границе изображения участвуют в меньшем количестве сверток, чем внутренние. В связи с этим в сверточных слоях используется дополнение изображения (англ. padding). Выходы с предыдущего слоя дополняются пикселями так, чтобы после свертки сохранился размер изображения. Такие свертки называют одинаковыми (англ. same convolution), а свертки без дополнения изображения называются правильными (англ. valid convolution). Среди способов, которыми можно заполнить новые пиксели, можно выделить следующие:
    • zero shift: 00[ABC]00;
    • border extension: AA[ABC]CC;
    • mirror shift: BA[ABC]CB;
    • cyclic shift: BC[ABC]AB.
  • Еще одним параметром сверточного слоя является сдвиг (англ. stride). Хоть обычно свертка применяется подряд для каждого пикселя, иногда используется сдвиг, отличный от единицы — скалярное произведение считается не со всеми возможными положениями ядра, а только с положениями, кратными некоторому сдвигу ss. Тогда, если если вход имел размерность w×hw×h, а ядро свертки имело размерность kx×kykx×ky и использовался сдвиг ss, то выход будет иметь размерность ⌊w−kxs+1⌋×⌊h−kys+1⌋⌊w−kxs+1 ×⌊h−kys+1⌋.

Пулинговый слой

Пулинговый слой призван снижать размерность изображения. Исходное изображение делится на блоки размером w×hw×h и для каждого блока вычисляется некоторая функция. Чаще всего используется функция максимума (англ. max pooling) или (взвешенного) среднего (англ. (weighted) average pooling). Обучаемых параметров у этого слоя нет.

Основные цели пулингового слоя:

  • уменьшение изображения, чтобы последующие свертки оперировали над большей областью исходного изображения;
  • увеличение инвариантности выхода сети по отношению к малому переносу входа;
  • ускорение вычислений.

Inception module

Inception module — это специальный слой нейронной сети, который был предложен в работе[2], в которой была представлена сеть GoogLeNet. Основная цель этого модуля заключается в следующем. Авторы предположили, что каждый элемент предыдущего слоя соответствует определенной области исходного изображения. Каждая свертка по таким элементам будет увеличивать область исходного изображения, пока элементы на последних слоях не будут соответствовать всему изображению целиком. Однако, если с какого-то момента все свертки станут размером 1×11×1, то не найдется элементов, которые покрывали бы все исходное изображение, поэтому было бы невозможно находить большие признаки на изображении.

Чтобы решить эту проблему, авторы предложили так называемый inception module — конкатенацию выходов для сверток размера 1×11×1, 3×33×3, 5×55×5, а также операции max pooling’а с ядром 3×33×3.

К сожалению, подобный наивный подход (англ. naive inception module) приводит к резкому увеличению слоев изображения, что не позволяет построить с его использованием глубокую нейронную сеть. Для этого авторы предложили использовать модифицированный inception module с дополнительным уменьшением размерности — дополнительно к каждому фильтру они добавили слой свертки 1×11×1, который схлопывает все слои изображения в один. Это позволяет сохранить малое число слоев, с сохранением полезной информации о изображении.

Residual block

Двумя серьезными проблемами в обучении глубоких нейронных сетей являются исчезающий градиент (англ. vanishing gradient) и взрывающийся градиент (англ. exploding gradient). Они возникают из-за того, что при дифференцировании по цепному правилу, до глубоких слоев нейронной сети доходит очень маленькая величина градиента (из-за многократного домножения на небольшие величины на предыдущих слоях). Для борьбы с этой проблемой был предложен так называемый residual block.

Идея заключается в том, чтобы взять пару слоёв (например, сверточных), и добавить дополнительную связь, которая проходит мимо этих слоёв. Пусть z(k) — выход k-ого слоя до применения функции активации, а a(k) — выход после. Тогда residual block будет выполнять следующее преобразование: a(k+2)=g(z(k+2)+a(k)), где g — функция активации.

На самом деле, такая нейронная сеть обучается предсказывать функцию F(x)−x, вместо функции F(x), которую изначально нужно было предсказывать. Для компенсации этой разницы и вводится это замыкающее соединение (англ. shortcut connection), которое добавляет недостающий x к функции.

Предположение авторов, которые предложили residual block, заключалось в том, что такую разностную функцию будет проще обучать, чем исходную. Если рассматривать крайние случаи, то если F(x)=x, такую сеть обучить нулю всегда возможно, в отличие от обучения множества нелинейных слоёв линейному преобразованию.

Что такое искусственный интеллект и как он работает? Применение и перспективы ИИ

Искусственный интеллект – это технология, а точнее направление современной науки, которое изучает способы обучить компьютер, роботизированную технику, аналитическую систему разумно мыслить также как человек. Собственно мечта об интеллектуальных роботах-помощниках возникла задолго до изобретения первых компьютеров.

Искусственный интеллект (ИИ), машинное обучение и нейронные сети — термины, используемые для описания мощных технологий, базирующихся на машинном обучении, способных решить множество задач из реального мира.

Изначально такие функции как размышление и принятие обдуманных решений у компьютеров отсутствовали, но в последние годы было сделано несколько важных открытий в области технологий ИИ и связанных с ними алгоритмов. Важную роль играет увеличивающееся количество доступных для обучения ИИ больших выборок разнообразных данных — Big Data.

Технология ИИ пересекается со многими другими областями, включая математику, статистику, теорию вероятностей, физику, обработку сигналов, машинное обучение, блокчейн, компьютерное зрение, психологию, лингвистику и науку о мозге. Вопросы, связанные с социальной ответственностью и этикой создания ИИ притягивают интересующихся людей, занимающихся философией.

Мотивация развития технологий ИИ состоит в том, что задачи, зависящие от множества переменных факторов, требуют очень сложных решений, которые трудны к пониманию и сложно алгоритмизируются вручную. Современные технологии машинного обучения и ИИ вкупе с правильно подобранными и подготовленными «тренировочными» данными для систем могут позволить нам научить компьютеры «думать» за нас — программировать, сочинять музыку, анализировать данные и на их основепринимать самостоятельные решения.

Как работает искусственный интеллект (AI)?

Искусственный интеллект — это способность цифрового компьютера или управляемого компьютером робота выполнять задачи, обычно связанные с разумными существами. Термин часто применяется к проекту развития систем, наделенных интеллектуальными процессами, характерными для человека, такими как способность рассуждать, обобщать или учиться на прошлом опыте.

Говоря простыми словами, ИИ — это грубое отображение нейронов в мозге. Сигналы передаются от нейрона к нейрону и, наконец, выводятся — получается числовой, категориальный или генеративный результат. Это можно проиллюстрировать на таком примере. Если система делает снимок кошки и обучена распознавать, кошка это или нет:

  • Первый слой может идентифицировать общие градиенты, которые определяют общую форму кошки.
  • Второй слой может идентифицировать более крупные объекты, такие как уши и рот.
  • Третий слой определяет более мелкие объекты (например, усы).

Наконец, основываясь на этой информации, программа выведет «да» или «нет», чтобы сказать, является ли это кошкой или нет. Программисту не нужно «говорить» нейронам, что это те функции, которые они должны искать. ИИ изучил их сам по себе, тренируясь на многих изображениях (как с кошками, так и без кошек).

Описание искусственного нейрона

Искусственный нейрон — это математическая функция, задуманная как модель биологических нейронов, нейронной сети. Искусственные нейроны — элементарные единицы в искусственных нейросетях. Искусственные нейронные сети создавались как математическая модель человеческого мозга. Для этого ученым Уоррену Мак-Каллоку и Уолтеру Питтсу пришлось выработать теорию деятельности человеческого мозга.

В нем отдельные нейроны представляют собой живые клетки со сложным устройством. У каждого нейрона есть дендриты — разветвленные отростки, способные обмениваться сигналами с другими нейронами через синапсы, а также один аксон — более крупный отросток, отвечающий за передачу импульса от нейрона. Часть синапсов отвечает за возбуждение нейрона, часть — за торможение. От того, какие сигналы и через какие синаптические связи придут на «вход» нейрона, будут зависеть и те импульсы, которые он передаст другим нейронам.

Для искусственного нейрона физический носитель не нужен. По большому счету, он представляет собой математическую функцию. Ее задача — получить информацию (например, сигналы от множества других искусственных нейронов), обработать ее определенным образом, а затем выдать результат на «аксон» — выход. В искусственной сети нейроны принято делить на три типа:

  • входные — каждый из этих нейронов получает на «вход» элемент исходной информации (например, одну точку изображения, если сеть распознает фотографии);
  • промежуточные — обрабатывают информацию;
  • выходные — выдают результат (при распознавании фото результатом может быть идентификатор изображенного объекта).

Сама нейросеть создается слоями, как пирог. Один из внешних слоев содержит входные нейроны, другой — выходные, а между ними могут располагаться один или несколько промежуточных. Каждый нейрон промежуточной сети соединен с множеством нейронов из двух окружающих слоев. Общение между нейронами обеспечивается с помощью весов — числовых значений, которые каждый нейрон вычисляет на основе данных, полученных от предыдущего слоя сети. 

Создавая искусственные нейронные сети, ученые ориентировались на устройство человеческого мозга. Поэтому принципы поведения рукотворных нейронов не так уж сильно отличаются от настоящих, живых. Может быть, и разум, который сможет развиться на основе таких нейросетей, будет приближен к человеческому?

Отличие искусственного интеллекта от человеческого

Интеллект можно определить как общую умственную способность к рассуждению, решению проблем и обучению. В силу своей общей природы интеллект интегрирует когнитивные функции, такие как восприятие, внимание, память, язык или планирование. естественный интеллект отличает осознанное отношение к миру.

Вопрос, чем ИИ отличается от естественного интеллекта, на самом деле лежит скорее в философской плоскости, чем в строго научной. И дело даже не в том, что мы не можем представить себе, на что будет похож (или не похож) искусственно созданный разум. Вообразить мы как раз способны что угодно — и писатели-фантасты многократно это доказали. Дело в том, что ни один искусственный интеллект, существующий на сегодняшний день, не достиг достаточно высокого уровня развития, чтобы состязаться с человеком на равных.

Существует точка зрения, высказанная философом Джоном Серлом еще в 1980-е годы. Он ввел термины «сильный ИИ» и «слабый ИИ». Сильный искусственный интеллект, по мнению ученого, может осознавать себя и мыслить подобно человеку. Слабый на это не способен. 

Сегодняшние ИИ, если классифицировать их по Серлу, однозначно относятся к слабым, поскольку ни у одного из них пока не зародилось самосознания. Наши искусственные нейросети распознают лица и рисуют странные, невероятные картины, читают рукописный текст и даже складывают стихи — но они и создавались исключительно для этих целей. Ни одна из этих нейросетей не способна передумать и выбрать для себя другую «специальность». Они делают лишь то, чему их обучили, и в некотором смысле их можно считать запрограммированными на выполнение этих задач. Подлинного понимания, что стоит за этими вещами, у них нет. Серл утверждал, что построение сильного ИИ в принципе невозможно.

Еще один философ, Хьюберт Дрейфус, также полагал, что компьютерные системы никогда не смогут сравняться с человеком — так как в своей разумной деятельности он опирается не только на усвоенные знания, но и эмпирический опыт. Компьютеры им не обладают по определению — следовательно, не судьба им развить собственный разум.

Но эти самоуверенные утверждения были сделаны во времена, когда нейросети делали только первые шаги. Сегодня, глядя на их успехи в обучении, нетрудно поверить в реальность ИИ, который сможет стать равным человеку, а то и превзойти его.

Базовый принцип интеллекта

Сравнить мышление человека с искусственным интеллектом можно исходя из нескольких общих параметров организации мозга и машины. Деятельность компьютера, как и мозга, включает четыре этапа: кодирование, хранение, анализ данных и выдачу результата.

Мозг человека и ИИ могут самообучаться в зависимости от данных, полученных из окружающей среды. Также человеческий мозг и машинный интеллект решают проблемы (или задачи), используя определенные алгоритмы.

История развития искусственного интеллекта

Первые работы в области ИИ начали вести в середине прошлого века. Пионером исследований в этом направлении стал Алан Тьюринг, хотя определенные идеи начали высказывать философы и математики в Средние века. В частности, еще в начале 20-го века была представлена механическое устройство, способное решать шахматные задачи.

Но по-настоящему это направление сформировалось к середине прошлого столетия. Появление работ по ИИ предваряли исследования о природе человека, способах познания окружающего мира, возможностях мыслительного процесса и других сферах. К тому времени появились первые компьютеры и алгоритмы. То есть, был создан фундамент, на котором зародилось новое направление исследований.

В 1950 году Алан Тьюринг опубликовал статью, в которой задавался вопросами о возможностях будущих машин, а также о том, способны ли они обойти человека в плане разумности. Именно этот ученый разработал процедуру, названную потом в его честь: тест Тьюринга.

После опубликования работ английского ученого появились новые исследования в области ИИ. По мнению Тьюринга, мыслящей может быть признана только та машина, которую невозможно при общении отличить от человека. Примерно в то же время, когда появилась статься ученого, зародилась концепция, получившая название Baby Machine. Она предусматривала поступательное развитие ИИ и создание машин, мыслительные процессы которых сначала формируются на уровне ребенка, а затем постепенно улучшаются.

Термин «искусственный интеллект» зародился позднее. В 1952 году группа ученых, включая Тьюринга, собралась в американском университете Дартмунда,чтобы обсудить вопросы, связанные с ИИ. После той встречи началось активное развитие машин с возможностями искусственного интеллекта.

Особую роль в создании новых технологий в области ИИ сыграли военные ведомства, которые активно финансировали это направление исследований. Впоследствии работы в области искусственного интеллекта начали привлекать крупные компании.

Современная жизнь ставит более сложные задачи перед исследователями. Поэтому развитие ИИ ведется в принципиально других условиях, если сравнивать их с тем, что происходило в период зарождения искусственного интеллекта. Процессы глобализации, действия злоумышленников в цифровой сфере, развитие Интернета и другие проблемы – все это ставит перед учеными сложные задачи, решение которых лежит в области ИИ.

Несмотря на успехи, достигнутые в этой сфере в последние годы (например, появление автономной техники), до сих пор не утихают голоса скептиков, которые не верят в создание действительно искусственного интеллекта, а не очень способной программы. Ряд критиков опасается, что активное развитие ИИ вскоре приведет к ситуации, когда машины полностью заменят людей.

Направления исследований ИИ

Философы пока не пришли к единому мнению о том, какова природа человеческого интеллекта, и каков его статус. В связи с этим в научных работах, посвященных ИИ, встречается множество идей, повествующих, какие задачи решает искусственный интеллект. Также отсутствует единое понимание вопроса, какую машину можно считать разумной.

Сегодня развитие технологий искусственного интеллекта идет по двум направлениям:

  • Нисходящее (семиотическое). Оно предусматривает разработку новых систем и баз знаний, которые имитируют высокоуровневые психические процессы типа речи, выражения эмоций и мышления.
  • Восходящее (биологическое). Данный подход предполагает проведение исследований в области нейронных сетей, посредством которых создаются модели интеллектуального поведения с точки зрения биологических процессов. На базе этого направления создаются нейрокомпьютеры.

Что такое тест Тьюринга?

Тест Тьюринга определяет способность искусственного интеллекта (машины) мыслить так же, как человек. 

В 1950 году Тьюринг опубликовал статью «Вычислительные машины и разум», в которой обсуждал вопросы теоретической возможности мышления у машин. Это было не первое исследование на тему искусственного интеллекта и даже не первая подобная работа Тьюринга, но именно она стала отправной точкой серьезных научных дискуссий и споров. 

Тьюринг начал с определений, чтобы уточнить вопрос о том, может ли машина думать, — он показался ему слишком размытым. Что за машина имеется в виду? Что вообще означает «думать»?.. Было очевидно, что такой вопрос изначально несет в себе иррациональное зерно, которое не позволит дать на него правильный ответ. Результатом размышлений ученого стал тест Тьюринга — эксперимент, в котором человеку («судье») предлагается общаться с двумя собеседниками: человеком и компьютером. Задача судьи — понять, кто есть кто. Если в результате он не уверен, который из его собеседников — программа, или ошибся в оценке, считается, что машина прошла тест.

Суть теста Тьюринга не в создании «машины-обманщика», способной притвориться человеком. Он помогает убедиться в том, что конкретная машина или программа обладает разумом, который трудно отличить от человеческого. Такой компьютер Тьюринг назвал «интеллектуальным» — этому определению уже более 60 лет, и оно остается актуальным.

Технологические принципы работы искусственного интеллекта

  • Машинное обучение (МО) – принцип развития ИИ на основе самообучающихся алгоритмов. Участие человека при таком подходе ограничивается загрузкой в «память» машины массива информации и постановкой целей. Существует несколько методик МО: обучение с учителем – человек задает конкретную цель, хочет проверить гипотезу или подтвердить закономерность. Обучение без учителя – результат интеллектуальной обработки данных неизвестен – компьютер самостоятельно находит закономерности, учится думать как человек. Глубокое обучение – это смешанный способ, главное отличие в обработке больших массивов данных и использование нейросетей.
  • Нейросеть – математическая модель, которая имитирует строение и функционирование нервных клеток живого организма. Соответственно в идеале – это самостоятельно обучаемая система. Если перенести принцип на технологическую основу, то нейросеть – это множество процессоров, которые выполняют какую-то одну задачу в масштабном проекте. Другими словами суперкомпьютер – это сеть из множества обычных компьютеров.
  • Глубокое обучение относят в отдельный принцип ИИ, так как этот метод используется для обнаружения закономерностей в огромных массивах информации. Для такой непосильной человеку работы, компьютер использует усовершенствованные методики.
  • Когнитивные вычисления – одно их направлений ИИ, которое изучает и внедряет процессы естественного взаимодействия человека и компьютера, наподобие взаимодействия между людьми. Цель технологии искусственного интеллекта заключается в полной имитации человеческой деятельности высшего порядка – речь, образное и аналитическое мышление.
  • Компьютерное зрение – это направление ИИ используется для распознавания графических и видеоизображений. Сегодня машинный интеллект может обрабатывать и анализировать графические данные, интерпретировать информацию в соответствии с окружающей обстановкой.
  • Синтезированная речь. Компьютеры уже могут понимать, анализировать и воспроизводить человеческую речь. Мы уже можем управлять программами, компьютерами и гаджетами с помощью речевых команд. Например, Siri или Google assistant, Алиса в Яндексе и другие.

Кроме того, трудно представить существование искусственного интеллекта без мощных графических процессоров, которые являются сердцем интерактивной обработки данных. Для интеграции ИИ в различные программы и устройства необходима технология API – программные интерфейсы приложений. Используя API можно без труда добавлять технологии искусственного интеллекта в любые компьютерные системы: домашняя безопасность, умный дом, оборудование на ЧПУ и прочее.

Основные проблемы ИИ на сегодняшний день

Как вы понимаете возможности искусственного интеллекта на данной стадии развития не безграничны. Перечислим главные трудности:

  • Обучение машин возможно только на основе массива данных. Это означает, что любые неточности в информации сильно сказываются на конечном результате.
  • Интеллектуальные системы ограничены конкретным видом деятельности. То есть умная система, настроенная на выявление мошенничества в сфере налогообложения, не сможет выявлять махинации в банковской сфере. Мы имеем дело с узкоспециализированными программами, которым ещё далеко до многозадачности человека.
  • Интеллектуальные машины не являются автономными. Для обеспечения их «жизнедеятельности» необходима целая команда специалистов, а также большие ресурсы.

Пределы глубокого обучения и нейросетей

Несмотря на все свои преимущества, глубокое обучение и нейросети все еще имеют существенные недостатки.

  • Зависимость от данных: в целом, алгоритмы глубокого обучения требуют огромного количества обучающих данных для точного выполнения своих задач. К сожалению, для решения многих проблем недостаточно качественных данных обучения для создания рабочих моделей.
  • Непредсказуемость: нейронные сети развиваются каким-то странным путем. Иногда все идет как задумано. А иногда (даже если нейросеть хорошо справляется со своей задачей), даже создатели изо всех сил пытаются понять, как же алгоритмы работают. Отсутствие предсказуемости делает чрезвычайно трудным устранение и исправление ошибок в алгоритмах работы нейросетей.
  • Алгоритмическое смещение: алгоритмы глубокого обучения так же хороши, как и данные, на которых они обучаются. Проблема заключается в том, что обучающие данные часто содержат скрытые или явные ошибки или недоработки, и алгоритмы получают их «в наследство». Например, алгоритм распознавания лиц, обученный в основном на фотографиях белых людей, будет работать менее точно на людях с другим цветом кожи.
  • Отсутствие обобщения: алгоритмы глубокого обучения хороши для выполнения целенаправленных задач, но плохо обобщают свои знания. В отличие от людей, модель глубокого обучения, обученная играть в StarCraft, не сможет играть в другую подобную игру: скажем, в WarCraft. Кроме того, глубокое обучение плохо справляется с обработкой данных, которые отклоняются от его учебных примеров.

Сферы применения технологии ИИ

Сферы применения ИИ достаточно широки и охватывают как привычные слуху технологии, так и появляющиеся новые направления, далекие от массового применения, иначе говоря, это весь спектр решений, от пылесосов до космических станций. Можно разделить все их разнообразие по критерию ключевых точек развития.

ИИ — это не монолитная предметная область. Более того, некоторые технологические направления ИИ фигурируют как новые подотрасли экономики и обособленные сущности, одновременно обслуживая большинство сфер в экономике.

Развитие применения использования ИИ ведет к адаптации технологий в классических отраслях экономики по всей цепочке создания ценности и преобразует их, приводя к алгоритмизированию практически всего функционала, от логистики до управления компанией. Несомненно в скором времени искусственный интеллект как и криптовалюты прочно войдут в нашу повседневную жизнь.

ИИ в интернете

Всякий раз, когда вы произносите «Окей, Гугл» или «Привет, Сири», вы обращаетесь к искусственному интеллекту в вашем смартфоне. Он способен распознать в сигнале с микрофона обращенную к нему речь. Он записывает ваш вопрос и пересылает на серверы Google или Apple. Там к делу подключается второй ИИ, который распознает речь и переводит вопрос в понятный компьютеру формат. А затем третий выполняет поиск ответа по гигантским базам данных. Наконец, ответ возвращается на ваш смартфон, где ИИ, генерирующий человеческий голос, озвучивает его для вас. И все это за доли секунды.

ИИ на транспорте и в логистике

Впечатляющее применение искусственных нейросетей — беспилотные автомобили. За последнее десятилетие разрабатывать машину, которая была бы способна самостоятельно перемещаться по дорогам, взялись многие автопроизводители — General Motors, Nissan, BMW, Honda, Volkswagen, Audi, Volvo, а также компании Google и Tesla. Беспилотники пока не стали массовым явлением на улицах наших городов, но они явно делают успехи. 

Компания Amazon с 2013 года разрабатывает идею доставки товаров и почтовых отправлений с помощью дронов. Впервые посылка прибыла к получателю с беспилотным летательным аппаратом еще в декабре 2016. В некоторых регионах дронами доставляют еду, лекарства и даже портативные дефибрилляторы. Система пока не идеальна, но она продолжает развиваться. К сожалению, дроны могут служить и противозаконным целям: зафиксированы случаи доставки запрещенных предметов в тюрьмы с помощью беспилотников, а также использование дронов для перевозки наркотиков.

ИИ в финансах

В финансовой сфере ИИ применяют для прогнозирования рисков, выявления мошенничества. Корпорация MasterCard, создавшая международную платежную систему, несколько лет назад внедрила сервис Decision Intelligence. Он призван повысить точность подтверждения подлинных транзакций и снизить вероятность ложных отклонений платежей — это ошибочное срабатывание встроенной системы безопасности, которая не позволяет совершить корректную транзакцию, принятую за мошенническую. Подобные ошибки наносят вред как продавцу, теряющему клиента, так и покупателю, не получающему товар. Убытки получаются даже выше, чем ущерб от мошенничества. 

Система, работающая на искусственной нейросети, использует информацию из множества источников, чтобы на лету оценивать, насколько транзакция «нормальна». Учитывается не только надежность и история транзакций продавца, но даже типичность покупки для покупателя и его местоположение, а также время суток. Все это помогает надежнее защитить людей от мошенничества и минимизировать ложные срабатывания.

ИИ в медицине

В здравоохранении ИИ развивается в первую очередь в области диагностики заболеваний. Искусственные нейросети научились распознавать раковые опухоли на рентгеновских снимках, КТ, маммографии и МРТ. Опытному врачу на изучение снимка требуется около 20 минут, а нейросети — считаные секунды. Так что пациент может узнать результаты обследования практически мгновенно. Особенно приятно, что такие разработки ведутся и в России.

Диагностирующие ИИ способны выявлять не только рак, но и ранние стадии болезни Альцгеймера, пневмонию и другие заболевания. 

В обороне и военном деле

В 2018 году стало известно, что в армии США разрабатывается ИИ, способный распознавать человеческие лица в темноте и даже сквозь стены — с помощью тепловизора. Ожидается, что технология поможет выявлять главарей банд в местах военных действий. 

Другой ИИ — ALPHA — создан для управления беспилотными истребителями и ведения воздушного боя. В одном из сражений на симуляторах компьютер победил, управляя одновременно четырьмя самолетами против двух противников-людей. 

Разрабатываются также системы прицеливания для танков, способные заметить закамуфлированные цели.

В военно-промышленном комплексе ИИ поможет повысить обороноспособность стран, но может стать и оружием террора.

В бизнесе и торговле

В ритейле ИИ производит революцию. Искусственные нейросети улучшают качество сервиса и обеспечивают индивидуальный подход к каждому потребителю. Умные технологии выявляют мошенничества с банковскими картами, дают персональные советы и помогают подобрать товар.

Согласно данным TAdviser, в 2018 году свыше трети всех доходов ритейла было получено благодаря рекомендациям на основе ИИ! 

ИИ в спорте

Здесь ИИ-технологии используют для прогнозирования результатов матчей — такие системы созданы компаниями UBS, Commerzbank и Microsoft. Учитывается опыт команды и отдельных игроков. Порой прогнозы оказываются верными, но зачастую искусственный интеллект серьезно просчитывается. Человеческий фактор способен опровергнуть любые предсказания.

ИИ в культуре

Машина не может заниматься творчеством, потому что у нее нет воображения! Или все же может?

Как ни странно, искусственные нейросети способны проявить креативность, и даже достигают определенных высот в сфере культуры. 

Музыка

Как звучала бы флейта, если бы была ситаром? Синтезатор NSynth Super от Google использует нейронную сеть, чтобы создавать совершенно новые звуки на основе разных инструментов.

Проект Sony Flow Machines идет дальше. Анализируя подборку песен, электронный композитор вырабатывает собственную оригинальную мелодию. В 2016 году компания представила сингл Daddy’s Car, основанный на музыке The Beatles. 

Alice, разработанная в рамках стартапа Popgun, умеет «подыгрывать» человеку, создавая музыкальные импровизации. Американская певица Тэрин Саузерн выпустила альбом в соавторстве с нейросетью Amper. А проект Endel способен по нажатию одной кнопки создавать композиции, созвучные настроению пользователя. 

Живопись

Нейросеть DeepDream создавали с прицелом на распознавание лиц, а у нее обнаружились способности к сюрреалистической живописи. Разработчики открыли сайт, на котором любой желающий может в сотрудничестве с ИИ создать удивительное полотно. Нейросеть пишет картины в разных стилях.

Правда, придумывать сюжеты она пока не умеет — просит помощи человека. 

Видео

С помощью ИИ, разработанных Google и Facebook, можно «заставить» человека на экране произнести любые слова, изобразить весь спектр эмоций. И отличить такие ролики от настоящих бывает непросто. Нейросети могут даже заменить одного актера на другого в отснятом кино. А это открывает возможности не только для кинематографистов, но и для создателей фальшивок. 

Литература

Нейросеть от Facebook умеет писать стихи, идеально выдерживая размер и ритм, подбирая хорошие рифмы. Читатели лишь в половине случаев сумели распознать сгенерированные компьютером строки, но до настоящих поэтов ИИ далеко. Машина пока не научилась передавать эмоции и вкладывать смысл в стихотворные произведения.

Яндекс тоже запустил «Автопоэта», который создавал стихотворения из поисковых запросов пользователей. Некоторые невозможно читать без улыбки. Трудно поверить, что их сочинила нейросеть, лишенная чувства юмора!

А компания Narrative Science разработала электронного журналиста. Пока статьи, написанные ИИ, просты по содержанию, но руководство компании с оптимизмом смотрит в будущее и верит, что к 2025 году до 90 % текстов в интернете будут написаны с помощью машинного интеллекта.

В 2016 году книга «День, когда компьютер напишет роман» вышла в финал японской литературной премии имени Хоси Синъити. Это произведение почти полностью создал искусственный интеллект.

Игры

В компьютерных играх нейросети используются для управления противниками и игровыми ботами. Но ИИ можно научить играть и «по другую сторону экрана» — то есть считывать визуальную информацию с экрана и управлять игровым персонажем, как это делает человек. 

В 2016 году между ИИ даже проводился чемпионат по Doom. А система Deep-Q-Network обучена играть на классических аркадных автоматах Atari. Зачастую она показывает результаты до 30 % выше, чем у опытных игроков.

В XX веке считалось, что искусственный интеллект можно будет считать достаточно мощным и развитым, когда он сумеет обыграть чемпиона мира по шахматам. Этот этап компьютеры прошли уже давно — еще в 1997 году Deep Blue одержал победу над Гарри Каспаровым (причем это была алгоритмическая программа, а не искусственный интеллект). 

После этого внимание публики обратилось к более сложным тактическим играм, например го. Сложность вычислений хода здесь на порядок выше, чем в шахматах, поэтому создать алгоритмы, которые перебирали бы возможные варианты, практически невозможно. Но обученные нейросети сумели справиться и с этой игрой. Уже в 2015 году разработанная Google сеть AlphaGo выиграла матч у профессионального игрока в го.

Перспективы развития искусственного интеллекта в будущем

Компьютеры теперь могут делать многое из того, что раньше могли делать только люди: играть в шахматы, распознавать буквы алфавита, проверять орфографию, грамматику, распознавать лица, диктовать, говорить, выигрывать игровые шоу и многое другое.

Но скептики упорствуют. Как только удается автоматизировать очередную человеческую способность, скептики говорят, что это лишь еще одна компьютерная программа, а не пример самообучающегося ИИ.

Технологии ИИ только находят широкое применение и имеют огромный потенциал роста во всех сферах. Со временем человечество будет создавать все более мощные компьютеры, которые будут все более совершенствоваться в развитии ИИ.

Цель ИИ — поместить человеческий разум в компьютер?

Нет, это не так. Даже теоретически подобная ситуация не так уж невероятна. Искусственные нейросети создаются по образу человеческого мозга, хотя и в очень упрощенном виде. Может быть, однажды станет возможно просканировать все разделы мозга живого человека, составить «карту» его нейронов и синаптических связей и воспроизвести ее копию в компьютере. От такой скопированной нейросети можно ожидать не только разумного поведения — она буквально будет двойником человека, сможет осознавать себя, принимать решения и совершать поступки, как он. Скопируются даже воспоминания. Теоретически, можно будет поместить такую нейросеть в искусственное тело (в робота), и тогда человек — копия его сознания — сможет жить практически вечно.

На практике осуществить такой перенос будет невероятно сложно: нет технологий, которые позволили бы «прочитать» живой мозг и создать его «карту». И мы пока очень далеки от создания искусственной нейросети, которая была бы столь же мощной, как мозг.

ИИ стремится достичь человеческого уровня интеллекта?

Цель ИИ — помогать людям и брать на себя сложные или рутинные задачи. Для этого ему вовсе не обязательно поддерживать беседы на философские темы или сочинять поэмы. 

Тем не менее, если искусственный интеллект однажды сможет достичь уровня человеческого мышления, это будет важной вехой для цивилизации. Мы получим дельного и умного помощника — и сможем по праву гордиться тем, что это творение наших рук.

Когда искусственный интеллект достигнет человеческого уровня?

Мы успешно создаем сравнительно небольшие нейросети, способные распознать голос или обработать изображение. Никакой ИИ пока не обладает такой же пластичностью, как наш мозг. 

Человек может сегодня заниматься музыкой, а завтра взяться за программирование на C++ — благодаря невероятной сложности мозга. В нем 86 миллиардов нейронов и бесчисленное количество синаптических связей между ними. 

Искусственным нейросетям пока далеко до этих показателей: у них от нескольких тысяч до миллионов нейронов. Есть технические ограничения на размеры нейросетей: даже суперкомпьютеры не «потянут» нейросеть, сопоставимую по масштабам с человеческим мозгом. Не говоря о том, что ее обучение будет нетривиальной задачей. 

Скорость компьютеров позволяет им обладать интеллектом?

«Мощность» интеллекта связана не со скоростью вычислений, а со сложностью нейронной сети. Человеческий мозг пока превосходит по мощности любую искусственную нейросеть, несмотря на то что скорость процессов в нем существенно ниже, чем в компьютерах. 

Искусственные нейронные сети состоят из отдельных нейронов, которые группируются в слои. Два внешних слоя служат «входом», на который подается исходная информация, и «выходом», с которого считывается результат. Между ними могут располагаться от одного до нескольких десятков, а то и сотен, промежуточных слоев из нейронов. Причем каждый нейрон в слое соединен с множеством других в предыдущем и следующем слоях. 

Чем сложнее устроена сеть, чем больше в ней слоев и нейронов, тем более масштабные и серьезные задачи она может выполнять. 

Может ли нейросеть развиваться естественным путем?

Разберемся, вероятно ли, что ИИ сможет получать опыт и обучаться естественно, как ребенок. Человеческий разум формируется под воздействием множества факторов. Мы получаем информацию о внешнем мире благодаря органам восприятия — наблюдая, осязая, пробуя на вкус. Взаимодействуя с окружающей средой, получаем жизненный опыт, знания о свойствах мира, социальные навыки. Наш мозг постоянно совершенствуется и физически меняется, наращивая новые синаптические связи и «прокачивая» существующие.

Если мы сумеем создать нейронную сеть, достаточно сложную, чтобы она могла развиваться подобным образом, и снабдим ее «органами чувств» — видеокамерой, микрофоном и подобным, — возможно, спустя время она сможет приобрести «жизненный опыт». Но это дело далекого будущего.

Как связаны с ИИ теория вычислимости и вычислительная сложность?

Теория вычислительной сложности фокусируется на классификации вычислительных задач в соответствии с присущей им сложностью и связывании этих классов друг с другом. Вычислительная задача — это задача, решаемая компьютером. Задача вычисления разрешима механическим применением математических шагов, таких как алгоритм.

Спасибо 

 

Получить консультацию

Получить подробную информацию о деятельности Клуба - Музея - Лектория можно по телефону:

8 985-304-31-48 Татьяна Робертовна

Яндекс.Метрика