P-значение (P-Value) - Лена Капаца
P-значение (P-Value) by Лена Капаца March 19, 2021

P-значение (значение вероятности) – это вероятность появления экстремального Наблюдения (Observation) при условии истинности Нулевой гипотезы (Null Hypothesis):

P-значение характеризует площадь розовой фигуры (в процентах) от кривой распределения

P-значение – это вероятность появления экстремального значения при пополнении исследуемой Выборки (Sample) или Генеральной совокупности (Population). P-значение по умолчанию считают равным 0,05 или 0,01.

P-значения используются при проверке истинности нулевых гипотез: чем оно меньше, тем больше вероятность, что вы отклоните нулевую гипотезу.

Нулевая гипотеза

Нулевая гипотеза – предположение, которое предстоит тестировать на истинность в рамках статистического анализа.

Пример. Мы хотим знать, есть ли разница в продолжительности жизни между двумя группами мышей, питавшихся по диетам A и B.

Нулевая гипотеза: диета не имеет влияния; нет разницы в продолжительности жизни между двумя группами.

Альтернативная гипотеза: диета имеет значение; между двумя группами существует разница в продолжительности жизни.

В нашем сравнении типов мышиного питания мы обнаружили, что средняя продолжительность жизни равна:

Более того, среди мышей, питающихся по типу A, нашлось менее 1% таких, что жили меньше 1,848 или больше 2,352 лет (то есть 2,1 ± 12%). То же верно и для группы B: в ней менее 1% примеров, когда мышь прожила менее 2,34 и более 2,86 года (то есть 2,6 ± 10%).

Наше сравнение двух диет для мышей дает p-значение менее 0,01, что ниже нашего порога по умолчанию – 0,05. Таким образом, мы определяем, что статистически значимая разница между двумя диетами существует.

Стандартизованная оценка

Зная Стандартизованную оценку (Z-score), мы можем вычислить занимаемую площадь ярко-розовой фигуры (p-значение). Например, z-оценка равна -0,37 (подробнее в статье о стандартизованной оценке):

Чтобы уточнить площадь ярко-розовой части фигуры, используется таблица z-оценок, в данном случае, для отрицательных значений коэффициента. Для числа '-0,37' мы должны найти строку '0.3' в левом столбце z и столбец с названием '0,7':

На пересечении ряда '-0,3' и столбца '0.07' находится число 0,35569, и это не только площадь фигуры, но и, к примеру, долю студентов за этой чертой успеваемости. Таким способом вычисляют самых способных.

Фото: @jeremybishop

© Лена Капаца. Все права защищены.