P-значение (значение вероятности) – это вероятность появления экстремального Наблюдения (Observation) при условии истинности Нулевой гипотезы (Null Hypothesis):
P-значение – это вероятность появления экстремального значения при пополнении исследуемой Выборки (Sample) или Генеральной совокупности (Population). P-значение по умолчанию считают равным 0,05 или 0,01.
P-значения используются при проверке истинности нулевых гипотез: чем оно меньше, тем больше вероятность, что вы отклоните нулевую гипотезу.
Нулевая гипотеза – предположение, которое предстоит тестировать на истинность в рамках статистического анализа.
Пример. Мы хотим знать, есть ли разница в продолжительности жизни между двумя группами мышей, питавшихся по диетам A и B.
Нулевая гипотеза: диета не имеет влияния; нет разницы в продолжительности жизни между двумя группами.
Альтернативная гипотеза: диета имеет значение; между двумя группами существует разница в продолжительности жизни.
В нашем сравнении типов мышиного питания мы обнаружили, что средняя продолжительность жизни равна:
Более того, среди мышей, питающихся по типу A, нашлось менее 1% таких, что жили меньше 1,848 или больше 2,352 лет (то есть 2,1 ± 12%). То же верно и для группы B: в ней менее 1% примеров, когда мышь прожила менее 2,34 и более 2,86 года (то есть 2,6 ± 10%).
Наше сравнение двух диет для мышей дает p-значение менее 0,01, что ниже нашего порога по умолчанию – 0,05. Таким образом, мы определяем, что статистически значимая разница между двумя диетами существует.
Зная Стандартизованную оценку (Z-score), мы можем вычислить занимаемую площадь ярко-розовой фигуры (p-значение). Например, z-оценка равна -0,37 (подробнее в статье о стандартизованной оценке):
Чтобы уточнить площадь ярко-розовой части фигуры, используется таблица z-оценок, в данном случае, для отрицательных значений коэффициента. Для числа '-0,37' мы должны найти строку '0.3' в левом столбце z и столбец с названием '0,7':
На пересечении ряда '-0,3' и столбца '0.07' находится число 0,35569, и это не только площадь фигуры, но и, к примеру, долю студентов за этой чертой успеваемости. Таким способом вычисляют самых способных.
Фото: @jeremybishop
© Лена Капаца. Все права защищены.