Описание выполненных задач:
- Установлены и импортированы библиотеки
numpy
,matplotlib.pyplot
иscipy.stats
для работы с данными и их визуализации. - Сгенерированы последовательности чисел размером 100 и 1000 для каждого из следующих распределений:
- Равномерное распределение
- Бернуллиевское распределение
- Биномиальное распределение
- Нормальное распределение
- Для каждой сгенерированной последовательности вычислены следующие статистические параметры:
- Среднее значение
- Дисперсия
- Стандартное отклонение
- Медиана
- Построены гистограммы плотностей относительных частот для каждой последовательности, что позволило визуализировать распределение данных.
Описание выполненных задач:
- Написана функция для вычисления эмпирической функции распределения и доверительного интервала.
- Сгенерированы выборки данных размером 100 и 1000 элементов для анализа.
- Построены графики для каждой выборки, включающие:
- Истинную функцию распределения
- Эмпирическую функцию распределения
- Границы доверительного интервала
- Аналогичные графики построены с использованием встроенных функций из библиотеки
statsmodels
для подтверждения результатов и сравнения методов.
Описание выполненных задач:
- Изучена документация и подключен модуль
scipy.stats.bootstrap
. - Сгенерированы четыре выборки данных: две из нормального распределения и две из биномиального распределения, каждая размером 100 и 1000 элементов.
- С помощью метода бутстрап оценены параметры распределений, включая доверительные интервалы для средних значений.
- Для нормального распределения построены графики плотности вероятности, отображающие истинное математическое ожидание, выборочное среднее и границы доверительного интервала.
- Выполнены оценки параметров распределений методом максимального правдоподобия для подтверждения результатов бутстрапа.
Описание выполненных задач:
- Изучена документация библиотеки
pandas
для работы с табличными данными. - Скачан и загружен датасет Wine Quality с помощью pandas.
- Выведено описание датасета и построены гистограммы для визуализации распределения данных.
- Построена матрица корреляций признаков и создана тепловая карта (heatmap) с помощью библиотеки
seaborn
. - Найдены признаки с максимальным и минимальным по модулю коэффициентом корреляции, построены их диаграммы рассеяния с линиями регрессии.
- Построена модель линейной регрессии с использованием метода
sm.OLS
, взяв в качестве зависимого признака последний столбец датасета. Выведено summary модели. - Сделаны три предсказания для некоторых строк и результаты сверены с истинными значениями.
Описание выполненных задач:
- Написана функция для выполнения простого одностороннего асимптотического теста.
- Написана функция для выполнения простого двустороннего асимптотического теста.
- На вход функциям подаются параметры: размер выборки, уровень значимости, ожидаемое среднее, выборочное среднее и стандартное отклонение.
- В результате работы функций строится числовая прямая с критическими точками, выделенной критической областью, значением критерия и p-value. Делается вывод о приеме или отвержении нулевой гипотезы.
Описание выполненных задач:
- Написана функция для выполнения теста равенства матожиданий двух нормальных совокупностей для больших выборок (одноторонний и двусторонний тест).
- Написана функция проверки гипотезы о равенстве дисперсий двух нормальных совокупностей для малых выборок по критерию Фишера.
- Написана функция для выполнения теста равенства матожиданий двух нормальных совокупностей для малых выборок по критерию Стьюдента.
- На вход функциям подаются параметры: размеры выборок, средние значения, дисперсии, уровень значимости, тип теста (одно- или двусторонний).
- Результаты тестов включают числовую прямую с критическими областями, значениями критериев, p-value и вердикт о приеме или отвержении нулевой гипотезы.
Описание выполненных задач:
- Реализован критерий Колмогорова-Смирнова по формулам.
- Для сверки результатов выводятся результаты встроенного теста Колмогорова-Смирнова (ks_2samp, kstest).
- Встроенными методами продемонстрирована проверка на нормальность по критериям Колмогорова-Смирнова и Шапиро-Вилка.
- Подготовлены выборки данных:
- Две различных нормальных выборки.
- Две одинаковых равномерных выборки.
- Одна биномиальная выборка.
Описание выполненных задач:
- Считаны данные из таблицы Google Sheets.
- Реализованы критерии проверки значимости коэффициента корреляции Пирсона и Спирмена по формулам.
- Проверена значимость корреляции между "Общей тревожностью" и "Общей социофобией".
- Сверены результаты со встроенными тестами.
- Проверена значимость корреляции между страхами: "Пауков и Начальства" и "Будущего и Ответственности" с использованием наиболее подходящего коэффициента корреляции Пирсона или Спирмена.
- Проверена нормальность распределения обоими критериями (Шапиро-Вилка и Колмогорова-Смирнова).
- В терминал выведены результаты проверки нормальности с названием критерия, вердикт о распределении, используемый коэффициент корреляции, его значение, p-value и вердикт значимости.
Описание выполненных задач:
- Выполнены две регрессии: линейная и нелинейная по Х.
- По графику временного ряда подобрана нелинейная функция регрессии.
- Произведена регрессия и проверены положения теоремы Гаусса-Маркова:
- Математическое ожидание остатков равно нулю.
- Дисперсия остатков одинаковая (проверка тестом Бреуша-Пагана).
- Остатки некоррелируют.
- На графике временного ряда показана кривая регрессии.
- Код написан таким образом, чтобы было удобно менять нелинейную функцию для тестирования.