• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Глава в книге
Assessment of the Impact of the Urban Environment on the Emotional State of Citizens

Burova A., Nikonov V.

In bk.: Proceedings of CIRMARE 2023. Recovery, Maintenance and Rehabilitation of Buildings. Cham: Springer, 2024. P. 233-241.

Препринт
Fast gradient-free activation maximization for neurons in spiking neural networks

Pospelov N., Chertkov A., Beketov M. et al.

arxiv Neural and Evolutionary Computing. arxiv:cs.NE. Cornell University, 2023

Основы теории вероятностей и математической статистики

2020/2021
Учебный год
RUS
Обучение ведется на русском языке
3
Кредиты
Статус:
Курс адаптационный
Когда читается:
1-й курс, 1 модуль

Преподаватель

Программа дисциплины

Аннотация

В результате освоения дисциплины будут получены знания об основных понятиях теории вероятностей, математической статистики, методах статистического анализа данных в прикладных задачах в пределах программы курса; базовые навыки «прочтения» и содержательной интерпретации статистических данных, специфика применения вероятностно-статистического подхода.
Цель освоения дисциплины

Цель освоения дисциплины

  • Целью освоения дисциплины является формирование навыков визуализации и анализа данных, а также умения интерпретировать полученные статистические результаты.
Планируемые результаты обучения

Планируемые результаты обучения

  • уметь различать шкалы данных и знать особенности работы с данными, измеренными в различных шкалах
  • уметь описывать данные, измеренные в различных шкалах, используя методы описательной статистики
  • владеть навыками визуализации данных различных типов
  • уметь интерпретировать результаты, полученные в ходе разведывательного анализа данных
  • уметь реализовывать разведывательный анализ одной и нескольких переменных
  • знать индексы, применяемые в социальных науках, их особенности и ограничения
  • владеть основной терминологией теории вероятностей и статистики
  • знать логику проведения статистического исследования
  • знать устройство регрессионных моделей и понимать их применимость в контексте прикладных задач
  • знать логику реализации кластерного анализа и понимать его применимость при решении практических задач
  • знать логику реализации метода главных компонент и понимать его применимость для построения индексов в сфере коммуникаций
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Введение в анализ данных
    Представление данных: наблюдения и переменные. Шкалы данных: абсолютная, интервальная, порядковая, номинальная. Примеры индексов, используемых в социальных науках: индекс восприятия коррупции от Transparency International, индексы проекта Polity, индексы проекта Freedom House. Преобразование данных. Логарифмированная шкала и примеры ее использования.
  • Разведывательный анализ данных
    Описание данных: описательные статистики для данных разных типов. Минимальное и максимальное значение, размах. Среднее арифметическое и взвешенное среднее. Медиана, квантили и квартили. Примеры использования квантилей: децили в индексах экономического неравенства. Описание данных в номинальной шкале: абсолютные и относительные частоты. Визуализация распределения количественных данных: гистограмма и сглаженный график плотности распределения. Визуализация распределения качественных данных: столбиковая и круговая диаграммы. Визуализация динамики показателей. Поиск нетипичных значений в количественных данных. График «ящик с усами». Работа с пропущенными значениями: поиск и заполнение. Визуализация совместного распределения двух переменных: диаграмма рассеяния. Коэффициенты корреляции Пирсона и Спирмена. Корреляционные матрицы и тепловые карты (heat maps).
  • Основы теории вероятностей
    Случайный эксперимент и элементарный исход. Случайные события и действия с ними. Вероятности случайных событий. Независимость событий. Условная вероятность. Формула Байеса. Дискретные случайные величины. Ряд распределения. Математическое ожидание, дисперсия и стандартное отклонение случайной величины. Непрерывные случайные величины. Нормальное распределение. Экспоненциальное распределение.
  • Статистический вывод
    Планирование статистического исследования: генеральная совокупность и выборка. Репрезентативность выборки. Статистическая оценка как случайная величина. Закон больших чисел и центральная предельная теорема. Доверительный интервал и предельная ошибка выборки (погрешность). Статистические критерии и pvalue. Примеры статистических критериев: сравнение средних двух и более выборок. Выявление связи между переменными в количественной и порядковой шкале: проверка значимости коэффициентов корреляции. Выявление связи между переменными в качественной шкале: таблицы сопряженности и критерий хи-квадрат.
  • Регрессионный анализ
    Понятие регрессионной модели: зависимая и независимая переменная. Парная линейная регрессия. Проверка качества модели и коэффициент детерминации R-квадрат. Множественная линейная регрессия. Потенциальные проблемы модели и методы борьбы с ними. Логистическая регрессия. Коэффициенты модели и отношение шансов. Предсказательная сила и ошибки модели. Оценка качества логистической модели.
  • Кластерный анализ
    Кластерный анализ в социальных науках: примеры использования. Иерархический кластерный анализ: расстояния и методы агрегирования. Дендрограмма. Кластеризация методом К-средних. Оценка качества кластеризации.
  • Метод главных компонент
    Метод главных компонент в социальных науках: примеры использования. Логика метода главных компонент и его геометрическая интерпретация. Построение индексов на основе имеющихся данных с помощью метода главных компонент.
Элементы контроля

Элементы контроля

  • неблокирующий Домашние задания
    Домашние задания представляют собой набор закрытых и открытых вопросов по пройденному материалу, в зависимости от разбираемых тем могут включать задачи по теории вероятностей и статистике, задачи на интерпретацию графиков и статистических выдач, практические задачи, требующие использование Google Tables.
  • неблокирующий Экзамен
    Экзамен представляет собой набор закрытых тестовых вопросов, открытых вопросов разного типа, заданий на интерпретацию графиков и статистических выдач, задач по основам теории вероятностей. На экзамене студенту запрещается использовать материалы, кроме заранее подготовленного листа А4 с необходимой информацией, написанного своей рукой (не ксерокопия или лист другого студента, лист может быть исписан с двух сторон).
Промежуточная аттестация

Промежуточная аттестация

  • Промежуточная аттестация (1 модуль)
    0.6 * Домашние задания + 0.4 * Экзамен
Список литературы

Список литературы

Рекомендуемая основная литература

  • AP statistics, Sternstein, M., 2013
  • Анализ данных на компьютере : учеб. пособие, Тюрин, Ю. Н., 2008
  • Задачник по теории вероятностей для студентов социально - гуманитарных специальностей, Макаров, А. А., 2015

Рекомендуемая дополнительная литература

  • Agresti, A. (2013). Categorical Data Analysis (Vol. Third edition). Hoboken, NJ: Wiley. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=769330
  • Bruce, P. C., & Bruce, A. (2017). Practical Statistics for Data Scientists : 50 Essential Concepts (Vol. First edition). Sebastopol, CA: O’Reilly Media. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=nlebk&AN=1517577