Дисциплина «Введение в компьютерный и интеллектуальный анализ данных» знакомит студентов специальности 6-05-0533-09 Прикладная математика с основными методами современного анализа данных; понимание того, в каких условиях, для решения каких задач и при каких ограничениях указанные методы применяются.

При изучении дисциплины рассматриваются такие понятия, как анализ данных, деревья решений, искусственные нейронные сети. Особое внимание уделяется языку программирования R. Большое внимание в процессе изучения дисциплины уделяется задачам классификации, построению деревьев решений и искусственных нейронных сетей. Содержание дисциплины опирается на теоретические основы анализа данных: линейная алгебра, математический анализ, теория вероятностей и математическая статистика. Лабораторные занятия посвящены практике создания эффективных программ с помощью изученных ранее средств для реализации алгоритмов: язык R и RStudio.

Основой для изучения учебной дисциплины «Введение в компьютерный и интеллектуальный анализ данных» являются дисциплина информатики, изучаемый в базовой и средней школе, и дисциплины «Основы и методологии программирования», «Алгоритмы и структуры данных», «Основы высшей алгебры», «Теория вероятностей и математическая статистика».

Основная цель: знакомство с основными методами современного анализа данных, формирование у студентов знаний и умений, необходимых для проектирования и разработки эффективных алгоритмов анализа данных, формирование навыков работы с RStudio для анализа реальных данных.

Задачи изучения дисциплины:

 изучение базовых моделей, методов и алгоритмов статистического и интеллектуального анализа данных;

 изучение базовых возможностей языка R по статистическому и интеллектуальному анализу данных;

 приобретение практических навыков решения типовых задач анализа данных с помощью программной системы RStudio.

Развивающее значение учебной дисциплины «Введение в компьютерный и интеллектуальный анализ данных» заключается в формировании у обучающихся алгоритмической и статистической грамотности; развитии исследовательских умений аналитических способностей, креативности, необходимых для решения научных и практических задач; развитии познавательных способностей и активности: творческой инициативы, самостоятельности, ответственности и организованности; формировании способностей к саморазвитию, самосовершенствованию и самореализации.

В результате изучения учебной дисциплины студент должен 

знать:

-         основные этапы процесса интеллектуального анализа данных;

-         классификацию задач Data Mining;

-         математическую сущность ключевых алгоритмов;

-         понятия переобучения, недообучения, способы валидации моделей;

-         критерии оценки качества моделей для разных задач.

уметь:

-       загружать и предобрабатывать реальные наборы данных с использованием стандартных библиотек;

-       визуализировать структуру данных для первичного анализа;

-       реализовывать базовые алгоритмы с использованием готовых библиотек;

-       разделять выборку на обучающую и тестовую и применять кросс-валидацию для оценки стабильности модели;

-       интерпретировать результаты работы модели и формулировать выводы на языке предметной области

владеть навыками:

-       постановки задачи анализа данных в терминах машинного обучения;

-       диагностики состояния модели и выбора способа изменения состояния;

-       проведения сравнительного анализа нескольких моделей по заданным метрикам с ранжированием результатов;

-       документирования аналитического исследования в форме воспроизводимого кода;

-       критической оценки применимости алгоритма к конкретному набору данных с учетом его объема, размерности и типа признаков.

При изучении дисциплины на лекционных и лабораторных занятиях рекомендуется использовать следующие методы и технологии обучения: научное реферирование, демонстрации с использованием мультимедиа, компьютерные технологии, проблемный метод.