Основы машинного обучения: что нужно знать?

Основы машинного обучения: что нужно знать?

Что такое машинное обучение?

  • Машинное обучение (МО) — это один из методов искусственного интеллекта, решающий задачу не прямым способом, а путем поиска закономерностей в данных после обучения алгоритма на множестве примеров.

  • Такие алгоритмы могут отвечать на вопрос, является фрукт на фотографии бананом или яблоком, определять переходящих дорогу людей перед беспилотным автомобилем, распознавать спам во входящих письмах электронной почты, генерировать субтитры для видео на YouTube.

  • Ключевое отличие от традиционного программирования заключается в том, что разработчик не пишет строгий код для инструктирования системы отличать банан от яблока. Вместо этого он создает модель, которая учится различать фрукты на большом количестве данных. В данном случае — на огромном количестве изображений бананов и яблок.

Чем машинное обучение отличается от искусственного интеллекта?

  • Машинное обучение является одним из методов искусственного интеллекта (ИИ).

  • Наряду с ним существуют и другие подходы, используемые для создания систем ИИ. Например, эволюционные алгоритмы .

Методы машинного обучения

Существуют различные методы машинного обучения, включая моделирование процессов естественного отбора и экспертные системы. Эти системы позволяют компьютерам имитировать поведение человека-эксперта в определенной области, например, система автопилота самолета.

Типы машинного обучения

Выделяют три основных вида машинного обучения:

  • обучение с учителем;
  • обучение без учителя;
  • обучение с подкреплением.

Обучение с учителем

Этот метод позволяет машине находить закономерности на примерах, которые контролирует инженер.

Для обучения системы используются размеченные данные, например, изображения с аннотациями. Система научится распознавать объекты на фотографиях с высокой точностью при наличии достаточного количества примеров.

Однако этот метод требует огромных объемов помеченных данных, и некоторые датасеты могут достигать огромных размеров.

Google Open Images содержит множество примеров для обучения с учителем.

Около 9 млн изображений, YouTube-8M — 6 млн помеченных видео, а одна из первых баз такого типа — ImageNet — имеет более 14 млн разбитых по категориям изображений.

И это далеко не предел — размеры наборов обучающих данных продолжают увеличиваться. В 2019 году Facebook скомпилировал 3,5 млрд общедоступных фотографий в Instagram, используя прикрепленные к каждой из них хештеги в качестве меток. Использование одного миллиарда этих снимков для обучения системы распознавания объектов дало рекордный уровень точности — 85,4% по тесту ImageNet.

  • Что такое обучение без учителя?

    Алгоритмы задач обучения без учителя пытаются выявлять сходства во входных данных и разделять их на категории. Как правило, тренировки таких моделей проходят без вмешательства со стороны человека.

    Например, алгоритмы сервиса краткосрочного съема жилья Airbnb объединяет в кластеры дома, доступные для аренды по районам, а агрегатор новостей Google News каждый день создает подборки статей на похожие темы.

    Алгоритмы обучения без учителя не предназначены для выделения определенных типов данных. Они просто ищут информацию, которую можно сгруппировать по сходству, или выделить аномалии.

  • Что такое обучение с подкреплением?

    Данный метод подразумевает, что агенты ИИ научатся самостоятельно взаимодействовать со некой средой.

Подкрепление — это как игра в компьютерную игру, где геймер изучает правила в процессе и увеличивает производительность от уровня к уровню.

В 2013 году DeepMind разработала алгоритм глубокого обучения с подкреплением, который превзошел людей в широком спектре классических видеоигр .

В процессе многих циклов игры система строит модель того, какие действия позволят максимизировать счет и получить вознаграждение.

Алгоритм AlphaGo разработанной DeepMind в 2016 году обыграла профессионального игрока в го Ли Седоля со счетом 4:1, используя оценку ситуации в контексте событий и подстраиваясь под меняющиеся условия.

После обучения модель оценивают с помощью данных, которые не использовались во время тренировки.

  • Для разработки алгоритма обычно используется около 60% набора данных.
  • Еще 20% датасета отбирают для проверки прогнозов и корректировки дополнительных параметров, которые оптимизируют выходные данные модели.
  • Эта точная настройка предназначена для повышения точности прогноза модели при представлении новых данных.
  • Остальные 20% набора используются для тестирования выходных данных обученной и настроенной модели, чтобы проверить точность прогнозов при представлении новой информации.

Что способствует популярности машинного обучения?

  • Несмотря на то, что машинное обучение не является новой техникой, в последние годы интерес к этой области резко возрос.
  • Этому способствовала серия прорывных инноваций, благодаря которым МО установило новые рекорды точности в таких областях, как обработка естественной речи и компьютерное зрение.
  • Успех стал возможным благодаря двум факторам: огромное количество данных для обучения и доступность огромных мощностей для параллельных вычислений с помощью современных графических процессоров.
  • Кроме этого, появились целые облачные кластеры для машинного обучения.
  • Сегодня любой пользователь может использовать услуги компаний вроде Amazon, Google и Microsoft для разработки собственных моделей.
  • По мере роста популярности МО технологические гиганты создают специализированное оборудование, предназначенное для запуска и обучения моделей машинного обучения.
  • Например, Google занимается разработкой специализированных тензорных процессоров (TPU), которые ускоряют процесс обучения алгоритмов.
  • В 2021 году компания представила новые достижения и разработки в области машинного обучения.

Четвертая версия чипа для совершенствования облачной инфраструктуры Google . По словам разработчиков, кластер из 4096 TPUv4 сможет обеспечить производительность более одного экзафлопса .

Задачи МО все чаще выполняются на телефонах и компьютерах потребительского уровня, а не только в облачных центрах обработки данных. В 2017 году компания Apple представила iPhone X с процессором A11 Bionic, оборудованный специальным чипом для вычислений задач машинного обучения. С каждым годом компания совершенствует процессор, обеспечивая возможность развертывания требовательных алгоритмов на мобильных устройствах. Google также всячески старается поддерживать МО-гонку на мобильных устройствах. Летом 2021 года компания представила платформу Android ML и добавила TensorFlow Lite в сервисы Play. По словам разработчиков, благодаря этому обработка алгоритмов на устройстве обеспечит меньшую задержку, более эффективное использование батареи и функции, не требующие подключения к сети.

Для чего используют машинное обучение?

На сегодняшний день системы машинного обучения используются повсюду и являются краеугольным камнем современного интернета.

Каждый поисковой запрос в Google запускает сразу несколько моделей МО: распознавание текста, персонализация выдачи результатов и так далее. Точно так же работает система распознавания спама в Gmail, определяя мошеннические сообщения.

Рекомендательные системы в онлайн-магазинах могут предсказать , какой продукт вы захотите купить в следующий раз или какой фильм вам понравится на Netflix. Одним из наиболее ярких примеров использования машинного обучения в повседневной жизни являются виртуальные помощники вроде Siri от Apple, Alexa от Amazon или Google Assistant. Каждый из них в значительной степени полагается на МО для распознавания голоса и способности понимать естественный язык, а также нуждается в огромной информационной базе для ответов на запросы. Системы находят применение во множестве отраслей , включая:

  • компьютерное зрение для беспилотных автомобилей, дронов и робокурьеров;
  • обработка естественной речи для чат-ботов и виртуальных ассистентов;
  • распознавание лиц;
  • обнаружение опухолей на рентгеновских снимках;
  • возможность профилактического обслуживания инфраструктуры путем анализа данных датчиков Интернета вещей.

И это далеко не исчерпывающий список.

Объективны ли модели машинного обучения?

Качество и объем данных , используемых для обучения систем, влияют на задачи, для которых они подходят. В последнее время в научной среде растет обеспокоенность по поводу того, как системы машинного обучения кодифицируют человеческие предубеждения и социальное неравенство, отраженные в обучающих данных.

2016 году сотрудник Национального научного фонда с факультета лингвистики Вашингтонского университета Рэйчел Татман обнаружила Системы распознавания речи Google лучше работают с мужскими голосами , чем с женскими во время автоматического добавления субтитров к видео на YouTube. Она связала результат исследования с «несбалансированным тренировочным сетам», в которых преобладали говорящие мужчины.

Системы распознавания лиц сталкиваются с трудностями идентификации женщин и людей с темными оттенками кожи. Вопросы об этичности использования таких потенциально предвзятых систем для работы полиции привели к тому, что крупные технологические компании временно приостановили их продажу правоохранительным органам.

В июне 2020 года Amazon запретила правоохранительным органам США использовать программное обеспечение для распознавания лиц в разгар протестов против жестокости полиции. Спустя год компания продлила мораторий на неопределенный срок.

В 2018 году Amazon также отказалась от инструмента найма на основе машинного обучения, который определял кандидатов-мужчин в качестве предпочтительных.

По мере того, как системы машинного обучения переходят в новые области, такие как помощь в диагностике заболеваний, возможность смещения систем в сторону предоставления более качественных услуг или более справедливого лечения определенных групп людей становится все более серьезной проблемой.

На сегодняшний день продолжаются исследования способов снижения предвзятости в самообучающихся системах.

Подписывайтесь на новости Cryptoit в Telegram:

CryptoIt