• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Дополнительные главы теории вероятностей и математической статистики

2019/2020
Учебный год
RUS
Обучение ведется на русском языке
4
Кредиты
Статус:
Курс обязательный
Когда читается:
2-й курс, 4 модуль

Преподаватель

Программа дисциплины

Аннотация

Курс «Дополнительные главы теории вероятностей и математической статистики» знакомит слушателей со статистическими методами снижения размерности признакового пространства и методами классификации. Кроме того, студенты продолжают отрабатывать навыки регрессионного анализа, работая с моделями с переменными взаимодействия. Одним из форматов занятий является репликация результатов исследований с последующей критикой примененной стратегии эмпирического анализа. На занятиях для анализа данных используется RStudio. Для успешного освоения материала студенты должны знать основы линейной алгебры и статистики в объеме курсов «Математика и статистика» и «Теория вероятностей и математическая статистика».
Цель освоения дисциплины

Цель освоения дисциплины

  • Овладеть знаниями в области математической статистики и многомерных методов анализа, необходимыми в социальных науках.
Планируемые результаты обучения

Планируемые результаты обучения

  • Корректно интерпретирует оценки коэффициентов множественной регрессии, включающей переменные взаимодействия
  • Корректно применяет и интерпретирует результаты метода главных компонент
  • Корректно применяет и интерпретирует результаты факторного анализа
  • Корректно применяет и интерпретирует результаты кластерного анализа
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Снижение размерности многомерного признакового пространства
    Индекс как результат снижения размерности многомерного признакового пространства. Объяснение потребности в индексах. Размерность каких признаковых пространств может быть снижена? Постановка задачи метода главных компонент (МГК). Ковариационная / корреляционная матрица как основнойобъект. Алгоритм МГК. Главная компонента vs. среднее. Свойства главных компонент (взаимная ортогональность; наименьшее искажение геометрической структуры данных, наименьшая ошибка автопрогноза). Оценка качества снижения размерности: доля объясненной вариации и понятие информативность главнойкомпоненты, методы Г. Кайзера и Р.Б. Кеттелла.
  • Модель множеcтвенной линейной регрессии. Эффекты взаимодействия переменных и фиктивные переменные
    Модель множественной линейной регрессии: повторение. Эффекты взаимодействия переменных и фиктивные переменные. Регрессионный анализ в политологических исследованиях: дизайн исследования, подходы к анализу данных, интерпретация и репликация результатов соответствующих исследований.
  • Факторный анализ
    Разведывательный факторный анализ: постановка содержательной задачи, решаемой методом, допущения, интерпретация результатов, диагностика качества решения, визуализация результатов путевой диаграммой.Конфирматорный факторный анализ: сравнение с разведывательным ФА, постановка содержательной задачи, решаемой методом, допущения, идентификация модели, интерпретация результатов, диагностика качества решения, modification indices, expected parameter (value) change, визуализация результатов путевой диаграммы, виды инвариантности (конфигуративная, метрическая, скалярная), проверка инвариантности.
  • Классификация объектов
    Классификация как одна из общенаучных задач. Типология задач классификации: с обучением и без обучения, параметрическая и непараметрическая постановка задачи. Постановка задачи иерархической кластеризации. Понятия расстояния и его свойства. Виды расстоянийи проблема их выбора. Понятие типа (алгоритма) агломерации и его виды. Проблема выбора алгоритма агломерации. Определение числа кластеров в задаче иерархического кластерного анализа (дендрограмма и сосульчатая диаграмма (icicle plot)). Проблема устойчивости результатов. Методы валидизации результатов кластеризации.
Элементы контроля

Элементы контроля

  • неблокирующий Домашние задания
  • неблокирующий Самостоятельные работы
  • неблокирующий Контрольная работа
  • неблокирующий Экзаменационная работа
Промежуточная аттестация

Промежуточная аттестация

  • Промежуточная аттестация (4 модуль)
    0.2 * Домашние задания + 0.2 * Контрольная работа + 0.2 * Самостоятельные работы + 0.4 * Экзаменационная работа
Список литературы

Список литературы

Рекомендуемая основная литература

  • Прикладная статистика и основы эконометрики : учебник для вузов, Айвазян, С. А., 1998

Рекомендуемая дополнительная литература

  • Анализ данных на компьютере : учеб. пособие, Тюрин, Ю. Н., 2008