Дисциплина «Введение в компьютерный и интеллектуальный анализ данных» знакомит студентов специальности 6-05-0533-09 Прикладная математика с основными методами современного анализа данных; понимание того, в каких условиях, для решения каких задач и при каких ограничениях указанные методы применяются.
При изучении дисциплины рассматриваются такие понятия, как анализ данных, деревья решений, искусственные нейронные сети. Особое внимание уделяется языку программирования R. Большое внимание в процессе изучения дисциплины уделяется задачам классификации, построению деревьев решений и искусственных нейронных сетей. Содержание дисциплины опирается на теоретические основы анализа данных: линейная алгебра, математический анализ, теория вероятностей и математическая статистика. Лабораторные занятия посвящены практике создания эффективных программ с помощью изученных ранее средств для реализации алгоритмов: язык R и RStudio.
Основой для изучения учебной дисциплины «Введение в компьютерный и интеллектуальный анализ данных» являются дисциплина информатики, изучаемый в базовой и средней школе, и дисциплины «Основы и методологии программирования», «Алгоритмы и структуры данных», «Основы высшей алгебры», «Теория вероятностей и математическая статистика».
Основная цель: знакомство с основными методами современного анализа данных, формирование у студентов знаний и умений, необходимых для проектирования и разработки эффективных алгоритмов анализа данных, формирование навыков работы с RStudio для анализа реальных данных.
Задачи изучения дисциплины:
– изучение базовых моделей, методов и алгоритмов статистического и интеллектуального анализа данных;
– изучение базовых возможностей языка R по статистическому и интеллектуальному анализу данных;
– приобретение практических навыков решения типовых задач анализа данных с помощью программной системы RStudio.
Развивающее значение учебной дисциплины «Введение в компьютерный и интеллектуальный анализ данных» заключается в формировании у обучающихся алгоритмической и статистической грамотности; развитии исследовательских умений аналитических способностей, креативности, необходимых для решения научных и практических задач; развитии познавательных способностей и активности: творческой инициативы, самостоятельности, ответственности и организованности; формировании способностей к саморазвитию, самосовершенствованию и самореализации.
В результате изучения учебной дисциплины студент должен
знать:
- основные этапы процесса интеллектуального анализа данных;
- классификацию задач Data Mining;
- математическую сущность ключевых алгоритмов;
- понятия переобучения, недообучения, способы валидации моделей;
- критерии оценки качества моделей для разных задач.
уметь:
- загружать и предобрабатывать реальные наборы данных с использованием стандартных библиотек;
- визуализировать структуру данных для первичного анализа;
- реализовывать базовые алгоритмы с использованием готовых библиотек;
- разделять выборку на обучающую и тестовую и применять кросс-валидацию для оценки стабильности модели;
- интерпретировать результаты работы модели и формулировать выводы на языке предметной области
владеть навыками:
- постановки задачи анализа данных в терминах машинного обучения;
- диагностики состояния модели и выбора способа изменения состояния;
- проведения сравнительного анализа нескольких моделей по заданным метрикам с ранжированием результатов;
- документирования аналитического исследования в форме воспроизводимого кода;
- критической оценки применимости алгоритма к конкретному набору данных с учетом его объема, размерности и типа признаков.
При изучении дисциплины на лекционных и лабораторных занятиях рекомендуется использовать следующие методы и технологии обучения: научное реферирование, демонстрации с использованием мультимедиа, компьютерные технологии, проблемный метод.
- Учитель: Александр Петрович Кондратюк