В мире данных, аналитики, статистики и даже повседневной работы р-значения неизбежны. Они играют решающую роль в устранении случайности и повышении значимости наших мнений. Более низкие значения p указывают на более высокий уровень доверия к тезису. Но откуда на самом деле берутся эти p-значения?

В своем предыдущем посте я стремился дать интуитивное понимание того, как p-значения способствуют устранению случайности и повышению значимости наших мнений. Чем ниже p-значение, тем выше достоверность тезиса. Если интересно, вы можете прочитать эту статью для более подробной информации. В этой статье я углублюсь в основную и простую концепцию p-значений и их вычислений. Давайте изучим это дальше.

Вопреки тому, что вы могли подумать, p-значения не выводятся из сложных математических или статистических формул. На самом деле, вы можете определить свое собственное значение p, если вы приводите аргументы в пользу любой темы. У вас есть право устанавливать ограничения.

Представьте, что у вас есть дом, окруженный зеленым полем. Пока вы владеете своим домом и частью поля, нет четкой границы, указывающей, где заканчивается ваша собственность. Когда новый сосед приезжает и планирует построить забор для своего скота, он хочет знать, где заканчивается ваша земля и начинается его.

В этом сценарии вы говорите ему, что уверены, что земля в пределах 95 метров от вашей стены принадлежит вам, но вы не уверены в следующих 5 метрах. Ваш сосед должен решить, хочет ли он построить этот 5-метровый участок или оставить все как есть. По сути, вы установили предел или своего рода p-значение для своего свойства. Ваш сосед, с другой стороны, предполагает альтернативную гипотезу о том, что все, что находится дальше 95 метров, вам не принадлежит.

Преобразовывая эти абсолютные пределы в пропорции, которые являются синонимами вероятностей, вы устанавливаете доверительные интервалы. Пропорции за пределами этих интервалов известны как p-значения. Ваш сосед может работать в пределах этой области p-значения, чтобы избежать конфликтов.

Из этого примера мы можем сделать два ключевых момента. Во-первых, p-значения используются для сравнения пропорций, процентов или вероятностей между нормой и новым сценарием. В нашем примере нормой является то, что вы владеете недвижимостью на расстоянии до 100 метров от своей стены, а в новом сценарии ваш сосед определяет землю, которой вы не владеете. Во-вторых, у вас есть возможность установить свои собственные доверительные интервалы. Ваш сосед может проверить точки, лежащие в области низкой вероятности за пределами доверительных интервалов, чтобы определить право собственности на землю.

Теперь давайте применим эту концепцию к статистическому сценарию. Представьте, что вы участвуете в соревнованиях по баскетболу и хотите определить, являются ли игроки уроженцами вашего города или из других мест. Вы решаете изучить их высоты. Анализируя исторические записи баскетболистов, участвовавших в испытаниях, вы находите средний рост 180 см со стандартным отклонением 5 см.

На основе этих данных вы устанавливаете доверительные интервалы вокруг средней высоты. Игроки ростом от 170 до 190 см, скорее всего, являются уроженцами города, так как большинство местных игроков попадают в этот диапазон. Рост ниже 170 см или выше 190 см предполагает, что игрок может быть не местным и мигрировать из другой части страны.

Однако важно признать, что все еще существует вероятность встретить местного баскетболиста ростом 160 см или 195 см. Поэтому мы не можем категорично утверждать, что у местного игрока не может быть этих высот. Однако стоит отметить, что эти экстремальные высоты маловероятны для местных игроков и, скорее всего, возникнут случайно. Хотя вероятность найти местных игроков в этом диапазоне высот крайне мала, это не совсем невозможно.

Доверительные интервалы представляют собой диапазон 95%, а оставшиеся 5% считаются критической областью. Размер критической области определяется выбранным исследователем альфа-уровнем. Более низкий альфа-уровень затрудняет получение p-значения в критической области, в то время как более высокий альфа-уровень увеличивает вероятность нахождения исследовательской статистики в этой области.

В заключение, p-значения представляют собой вероятности событий, происходящих в критической области и за пределами доверительных интервалов. Однако наличие p-значения ниже, чем альфа, не доказывает вашу исследовательскую позицию; это просто указывает на то, что имеется достаточно доказательств для изучения направлений, выходящих за пределы обычных доверительных интервалов. Для получения уверенных выводов необходимы дополнительные статистические тесты.

Статья по теме: «p-значения — сложно понять? Больше нет | Абу Абдул | Середина"