Skip to content

Reveqqq/MathStat

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

7 Commits
 
 
 
 
 
 

Repository files navigation

Лабораторные работы по математической статистике

Лабораторная работа №1: Генерация последовательностей и базовый статистический анализ

Описание выполненных задач:

  1. Установлены и импортированы библиотеки numpy, matplotlib.pyplot и scipy.stats для работы с данными и их визуализации.
  2. Сгенерированы последовательности чисел размером 100 и 1000 для каждого из следующих распределений:
    • Равномерное распределение
    • Бернуллиевское распределение
    • Биномиальное распределение
    • Нормальное распределение
  3. Для каждой сгенерированной последовательности вычислены следующие статистические параметры:
    • Среднее значение
    • Дисперсия
    • Стандартное отклонение
    • Медиана
  4. Построены гистограммы плотностей относительных частот для каждой последовательности, что позволило визуализировать распределение данных.

Лабораторная работа №2: Эмпирическая функция распределения и доверительный интервал

Описание выполненных задач:

  1. Написана функция для вычисления эмпирической функции распределения и доверительного интервала.
  2. Сгенерированы выборки данных размером 100 и 1000 элементов для анализа.
  3. Построены графики для каждой выборки, включающие:
    • Истинную функцию распределения
    • Эмпирическую функцию распределения
    • Границы доверительного интервала
  4. Аналогичные графики построены с использованием встроенных функций из библиотеки statsmodels для подтверждения результатов и сравнения методов.

Лабораторная работа №3: Bootstrap и оценка параметров распределений

Описание выполненных задач:

  1. Изучена документация и подключен модуль scipy.stats.bootstrap.
  2. Сгенерированы четыре выборки данных: две из нормального распределения и две из биномиального распределения, каждая размером 100 и 1000 элементов.
  3. С помощью метода бутстрап оценены параметры распределений, включая доверительные интервалы для средних значений.
  4. Для нормального распределения построены графики плотности вероятности, отображающие истинное математическое ожидание, выборочное среднее и границы доверительного интервала.
  5. Выполнены оценки параметров распределений методом максимального правдоподобия для подтверждения результатов бутстрапа.

Лабораторная работа №4: Анализ данных на основе датасета Wine Quality

Описание выполненных задач:

  1. Изучена документация библиотеки pandas для работы с табличными данными.
  2. Скачан и загружен датасет Wine Quality с помощью pandas.
  3. Выведено описание датасета и построены гистограммы для визуализации распределения данных.
  4. Построена матрица корреляций признаков и создана тепловая карта (heatmap) с помощью библиотеки seaborn.
  5. Найдены признаки с максимальным и минимальным по модулю коэффициентом корреляции, построены их диаграммы рассеяния с линиями регрессии.
  6. Построена модель линейной регрессии с использованием метода sm.OLS, взяв в качестве зависимого признака последний столбец датасета. Выведено summary модели.
  7. Сделаны три предсказания для некоторых строк и результаты сверены с истинными значениями.

Лабораторная работа №5: Проверка гипотезы о равенстве среднего и гипотетического среднего

Описание выполненных задач:

  1. Написана функция для выполнения простого одностороннего асимптотического теста.
  2. Написана функция для выполнения простого двустороннего асимптотического теста.
  3. На вход функциям подаются параметры: размер выборки, уровень значимости, ожидаемое среднее, выборочное среднее и стандартное отклонение.
  4. В результате работы функций строится числовая прямая с критическими точками, выделенной критической областью, значением критерия и p-value. Делается вывод о приеме или отвержении нулевой гипотезы.

Лабораторная работа №6: Проверка гипотезы о равенстве матожиданий двух нормальных совокупностей

Описание выполненных задач:

  1. Написана функция для выполнения теста равенства матожиданий двух нормальных совокупностей для больших выборок (одноторонний и двусторонний тест).
  2. Написана функция проверки гипотезы о равенстве дисперсий двух нормальных совокупностей для малых выборок по критерию Фишера.
  3. Написана функция для выполнения теста равенства матожиданий двух нормальных совокупностей для малых выборок по критерию Стьюдента.
  4. На вход функциям подаются параметры: размеры выборок, средние значения, дисперсии, уровень значимости, тип теста (одно- или двусторонний).
  5. Результаты тестов включают числовую прямую с критическими областями, значениями критериев, p-value и вердикт о приеме или отвержении нулевой гипотезы.

Лабораторная работа №7: Критерии согласия

Описание выполненных задач:

  1. Реализован критерий Колмогорова-Смирнова по формулам.
  2. Для сверки результатов выводятся результаты встроенного теста Колмогорова-Смирнова (ks_2samp, kstest).
  3. Встроенными методами продемонстрирована проверка на нормальность по критериям Колмогорова-Смирнова и Шапиро-Вилка.
  4. Подготовлены выборки данных:
    • Две различных нормальных выборки.
    • Две одинаковых равномерных выборки.
    • Одна биномиальная выборка.

Лабораторная работа №8: Критерии значимости корреляции

Описание выполненных задач:

  1. Считаны данные из таблицы Google Sheets.
  2. Реализованы критерии проверки значимости коэффициента корреляции Пирсона и Спирмена по формулам.
  3. Проверена значимость корреляции между "Общей тревожностью" и "Общей социофобией".
  4. Сверены результаты со встроенными тестами.
  5. Проверена значимость корреляции между страхами: "Пауков и Начальства" и "Будущего и Ответственности" с использованием наиболее подходящего коэффициента корреляции Пирсона или Спирмена.
  6. Проверена нормальность распределения обоими критериями (Шапиро-Вилка и Колмогорова-Смирнова).
  7. В терминал выведены результаты проверки нормальности с названием критерия, вердикт о распределении, используемый коэффициент корреляции, его значение, p-value и вердикт значимости.

Лабораторная работа №9: Анализ временных рядов

Описание выполненных задач:

  1. Выполнены две регрессии: линейная и нелинейная по Х.
  2. По графику временного ряда подобрана нелинейная функция регрессии.
  3. Произведена регрессия и проверены положения теоремы Гаусса-Маркова:
    • Математическое ожидание остатков равно нулю.
    • Дисперсия остатков одинаковая (проверка тестом Бреуша-Пагана).
    • Остатки некоррелируют.
  4. На графике временного ряда показана кривая регрессии.
  5. Код написан таким образом, чтобы было удобно менять нелинейную функцию для тестирования.

About

Math Stat labs

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages