Компьютерное зрение

UrFU

Для зачисления на курс требуется приглашение

О курсе

Курс «Компьютерное зрение» посвящен подробному изучению наиболее популярных в настоящее время архитектур глубоких искусственных нейронных сетей в задачах компьютерного зрения. Данный подход наиболее востребован в настоящее время во многих приложениях реального сектора экономики, начиная от медицинских задач и задач промышленного контроля и диагностики и заканчивая такими приложениями, как «Deep fake», фильтрами изображений в социальных сетях и приложениями генерации изображений/видео. Особенностью курса является подробный теоретический разбор рассматриваемых архитектур нейронных сетей, а также разбор особенностей их обучения.

В рамках курса слушатель получит знания о современных практиках решения задач компьютерного зрения на основе глубокого обучения нейронных сетей. В теоретической части курса будут рассмотрены наиболее современные архитектуры глубоких нейронных сетей в контексте развития области компьютерного зрения. Будут показаны предпосылки, преимущества и недостатки, приводящие к современному состоянию рассматриваемой области знаний. Большая часть курса посвящена изучению задачи классификации изображений, как базовой для всех современных методов компьютерного зрения. Также будут рассмотрены такие задачи, как семантическая сегментация, обнаружение объектов, а также кратко освещены некоторые особенности экземплярной сегментации, задачи генерации и другие современные тенденции.

Практическая часть курса позволяет изучить один из наиболее современных и перспективных инструментов работы с нейронными сетями Pytorch (язык Python). Умение работы с данным инструментом широко востребовано в профессиональной среде, в том числе Pytorch является основой для многих современных проектов, выложенных в сети «Интернет» с открытым исходным кодом.

В результате прохождения курса слушатель получит навыки самостоятельного решения задач классификации изображений, их сегментации, а также обнаружения и локализации на них целевых объектов. При этом слушатель будет компетентен самостоятельно выбирать архитектуры сетей, особенности их обучения и подготовки данных.

Полученные в курсе знания позволят слушателю квалифицированно выполнять практические проекты и/или пройти собеседование в крупной компании на должность разработчика систем компьютерного зрения.

Автор курса

Михаил Ронкин

Кандидат технических наук, доцент ИРИТ-РТФ, УрФУ

Трудоемкость освоения курса

Длительность курса: 16 недель из расчета 4,5 часов в неделю.

Общая трудоемкость курса: 3 з. е.

Формат

Обучающимся предлагается изучить содержание ключевых тем трёх разделов курса (прослушать тематические видео-лекции, выполнить учебные и практические задания и ответить на вопросы тестов самоконтроля усвоенных знаний). По завершению освоения тем и разделов курса обучающимся предлагаются тесты промежуточного контроля по разделу. Итоговым контрольным мероприятием является итоговое тестирование.

Требования

Для обучения на курсе требуются базовые знания языка программирования Python, и основных используемых фреймворков, в первую очередь numpy, pandas и matplotlib. Необходимы базовые навыки использования Python анализа данных.

Также рекомендуются к освоению базовые курсы по машинному обучению и работе с глубокими нейронными сетями.

Программа курса

Раздел 1. Введение в предмет «Компьютерное зрение»
Тема 1.1. Введение в компьютерное зрение
Тема 1.2. Цифровое представление изображений
Тема 1.3. Обзор классических методов решения задач компьютерного зрения
Тема 1.4. Понятие «Признак изображения»
Тема 1.5. Место глубокого обучения среди других методов решения задач компьютерного зрения
Тема 1.6. Обзор операции свертка в приложении к сверточным нейронным сетям
Раздел 2. Основные архитектуры сверточный нейронных сетей
Тема 2.1. Обзор архитектуры LeNet, ее предпосылок и развития
Тема 2.2. Обзор некоторых операций регуляризации
Тема 2.3. Оптимизация архитектур сверточной нейронных сетей
Тема 2.4. Остаточные связи
Тема 2.5. Архитектуры для низко производительных устройств
Тема 2.6. Идеи внимания, Squeeze and Excitation Net
Тема 2.7. Идеи автоматического поиска
Раздел 3. Особенности семантической сегментации
Тема 3.1. Задача семантической сегментации
Тема 3.2. Архитектуры сегментации
Тема 3.3. Задача обнаружение и локализация объектов
Тема 3.4. Многоэтапные подходы к задаче обнаружение и сегментации объектов на изображениях
Тема 3.5. Одноэтапные подходы к обнаружению объектов на изображениях
Тема 3.6. Быстрые подходы к обнаружению объектов на изображениях
Тема 3.7. Задачи генерации
Тема 3.8. Современные тренды в решение задач компьютерного зрения

Результаты обучения

В результате освоения курса «Компьютерное зрение» обучающийся будет:

знать основные подходы к постановке и решению задач компьютерного зрения;
знать основные методы подготовки и обработки изображений, доступные в рамках соответствующих библиотек и на языке программирования Python;
знать основные методы решения задач компьютерного зрения при помощи нейронных сетей и их реализации в рамках соответствующих библиотек и на языке программирования Python;
уметь выбирать библиотеки и методы решения практических задач компьютерного зрения;
уметь выполнить подбор или модификацию алгоритмов обработки изображений в соответствии с характеристиками входных данных;
применять сверточные нейронные сети и других алгоритмов искусственного интеллекта к решению задач компьютерного зрения.

Формируемые компетенции

ОПК-8 - Способен разрабатывать алгоритмы и программные средства для решения задач в области создания и применения искусственного интеллекта

ПК-10 - Способен создавать прикладные информационные системы с использованием методов машинного обучения и интеллектуальной обработки данных

Направления подготовки

09.00.00 Информатика и вычислительная техника