Определение значимости результатов между собой. Определение значимости воздействия

Значимость воздействия является по сути комплексной (интегральной) оценкой. Определение значимости воздействия проводится в несколько этапов.

Этап 1. Для определения значимости воздействия на отдельные компоненты природной среды необходимо, использовать таблицы с критериями воздействий (Таблицы 5-1, 5-2 и 5-3). Балл значимости воздействия определяется по формуле 1 .

Q i = Q i t x Q i s x Q i j

1 Аддитивная система была использована в социально-экономической методологии по причине присутствия нулевых значений, которые аннулируют уравнение во время действии умножения при комплексной оценке воздействия на

природную среду

Q i

integr - комплексный оценочный балл для рассматриваемого воздействия;

Qi t - балл временного воздействия на i-й компонент природной среды;

Qi s - балл пространственного воздействия на i-й компонент природной среды;

Qi j - балл интенсивности воздействия на i-й компонент природной среды.

Категории значимости являются единообразными для различных компонентов природной среды и могут быть уже сопоставимыми для определения компонента природной среды, который будет испытывать наиболее сильные воздействия.

Для проведения ОВОС приняты три категории значимости воздействия - незначительное, умеренное и значительное, как показано в Текстовой Рамке 5.

Текстовая рамка 5

Воздействие низкой значимости имеет место, когда последствия испытываются, но величина воздействия достаточно низка (при смягчении или без смягчения), а также находится в пределах допустимых стандартов или рецепторы имеют низкую чувствительность \ ценность.
Воздействие средней значимости может иметь широкий диапазон, начиная от порогового значения, ниже которого воздействие является низким, до уровня, почти нарушающего узаконенный предел. По мере возможности необходимо показывать факт снижения воздействия средней значимости.
Воздействие высокой значимости имеет место, когда превышены допустимые пределы или когда отмечаются воздействия большого масштаба, особенно в отношении ценных \ чувствительных ресурсов.


· воздействия на почвы и недра;

· воздействия на поверхностные и морские воды;

· воздействия на подземные воды;

· воздействие на донные отложения;

· воздействие на качество атмосферного воздуха;

· воздействие на биологические ресурсы моря и суши;

· воздействия на ландшафты;

· физические факторы воздействия (шумовые воздействия, вибрация и др.).

Если значимость воздействия, определенная для конкретного компонента природной среды (атмосферный воздух, животный мир и др.) является единственной, то она используется напрямую для оценки результирующей значимости воздействия.

На практике на один компонент природной среды могут оказываться различные воздействия множества источников, поэтому для определения значимости воздействия используется результирующая оценка значимости для конкретного компонента природной среды. В зависимости от полученных баллов и критериев значимости можно определить результирующую оценку значимости воздействия. Пример определения результирующей значимости воздействия представлен в Таблице 5-5.

7. Экологический аудит – экономический инструмент управления природопользованием

Экологический аудит – экономический инструмент управления природопользованием.

Экономический механизм экологического регулирования – сложная многоуровневая система отношений субъектов хозяйствования между собой и с вышестоящими органами. Связующим рычагом этих отношений должен стать экологический аудит (ЭА) – инструмент, включающий в себя организационно-экономические факторы защиты окружающей среды. Он позволяет выбрать оптимальный вариант природоохранных сооружений, организовать информационно-аналитический контроль за состоянием и степенью эксплуатации природоохранной техники, дать экономическую оценку намечаемых технических и технологических усовершенствований.

Исходя из задач, особенностей составления программ и методики проведения, предлагаем следующее его определение: ЭА – независимое исследование всех аспектов хозяйственной деятельности промышленного предприятия любой формы собственности для установления размера прямого или косвенного воздействия на состояние окружающей среды. Его цель – приведение природоохранной деятельности в соответствие с требованиями законодательства и нормативных актов, оптимизация использования природных ресурсов, снижение и упорядочение энергопотребления, уменьшение отходов, предотвращение аварийных сбросов, выбросов и техногенных катастроф.

Поскольку речь идет об исследовании всех аспектов хозяйственной деятельности предприятия, ЭА должен объединить и расширить программы и методики уже существующих видов аудита – производственного, финансовой деятельности, аудита на соответствие.

Заключение экоаудитора будет содержать следующую информацию:

o выводы о соответствии природоохранной и производственной деятельности законодательству и нормативным актам;

o заключение о состоянии финансово-экономической отчетности, учета, своевременности и величине текущих экологических платежей, целенаправленности использования капитальных средств, выделенных на охрану окружающей среды;

o оценку воздействия аудируемого предприятия на состояние среды, здоровье производственного персонала, экологию в регионе, данные о наличии и величине выбросов (сбросов) загрязняющих веществ, производство которых ограничено или запрещено международными обязательствами государства;

o результаты анализа темпов роста производства продукции и количества выбросов и сбросов загрязняющих веществ, потребления энергетических и материальных ресурсов;

o результаты сравнительного анализа основных показателей природоохранной и производственной деятельности аудируемого предприятия и подобных предприятий в Украине и других странах;

o оценку потенциальной опасности аудируемого предприятия при возникновении аварийной ситуации, эффективность разработанного плана работ по ликвидации очагов аварии, наличие необходимых материально- технических средств;

o заключение о профессиональной компетентности работников природоохранных служб предприятия, их обеспеченности современными техническими средствами контроля за соблюдением допустимых величин загрязнения;

o информированность руководящего и производственного персонала о величине и характере загрязнения окружающей среды их предприятием, наличие материального и морального стимулирования за снижение уровня загрязнения и энерго- и материалоемкости выпускаемой продукции.

На основании заключения экоаудитора решить конкретную проблему (например, уменьшить количество или концентрацию определенного загрязняющего ингредиента) можно различными, часто альтернативными методами. В зависимости от радикальности принятого решения и остроты проблемы необходимые природоохранные мероприятия могут находиться в диапазоне от организационных мер и повышения контроля за ведением технологического процесса и работой средозащитного оборудования до закрытия предприятия с его последующим перепрофилированием.

Один из важных факторов, способствующих развитию ЭА в мире, представляет процедура реализации программы. В процессе проведения экоаудирования установление и наказание виновных – далеко не главная цель. Гораздо важнее для руководства компаний выявление узких мест во всех сферах деятельности объекта, оказывающих в той или иной степени негативное влияние на окружающую среду, и содействие в его уменьшении. Проведение объективного исследования невозможно без тесного сотрудничества с администрацией и производственным персоналом предприятия, т.е. без превращения его из подконтрольного в полноправного партнера, мнение и аргументация которого учитывается на всех этапах проведения ЭА.

ЭА предупреждает ситуацию, когда экологические проблемы волнуют лишь руководство компании, вынужденное на свой страх и риск скрывать негативные последствия производственной деятельности до предела, за которым их сокрытие станет невозможным, а устранение повлечет судебные разбирательства и санкции. С этой целью целесообразно привлечение к решению экологических проблем конкретного предприятия научного потенциала региона, сотрудников природоохранных служб, финансовых учреждений.

По данным Всемирного банка, возможное повышение стоимости проектов, связанное с проведением оценки воздействия на среду и последующим учетом экологических ограничений, окупается в среднем за 5-7 лет. Включение экологических факторов в процедуру принятия решений еще на стадии проектирования обходится в 3-4 раза дешевле последующей установки дополнительного очистного оборудования, а затраты на ликвидацию последствий от использования неэкологической технологии и оборудования оказываются в 30-35 раз выше расходов, которые потребовались бы для разработки экологически чистой технологии и применения экологически совершенного оборудования.

Объективное исследование комплексного влияния экоаудируемого предприятия на состояние окружающей среды с учетом мнений всех заинтересованных сторон поможет избежать дальнейшего усугубления эколого-экономического кризиса и определиться в методах учета экологического фактора при разработке стратегии и тактики хозяйственной деятельности. Это позволит повысить производственную безопасность предприятия, а следовательно, его инвестиционную привлекательность.

у меня нет ясности в понимании того, как определяется значимость ГОТОВЫХ контекстно-зависимых поведенческих цепочек. как я понимаю, поведенческая цепочна - это некоторая МОЗГОВАЯ активность. поведенческий контекст - это образ поведения при данном состоянии среды. состояние среды, отслеживается рецепторами органов чувств. чтобы определить значимость поведенческого контекста, надо получить предполагаемый результат поведения при данном состоянии среды, причем до того, как запустить поведенческую цепочку на выполнение. для этого к настоящему моменту в мозгу УЖЕ должен быть актевен образ вариантов поведений в некотором спектре состояний среды, содержащих отслеженное органами чувств в настоящий момент. так?


>>поведенческая цепочка - это некоторая МОЗГОВАЯ активность

Нет. Это последовательность звеньев, отвечающих за более элементарные действия в программе всей цепочки. По мере последовательной активности отдельных звеньев начинает выполняться вся программа отдельными подпрограммами.

>>поведенческий контекст - это образ поведения при данном состоянии среды

В одной цепочке в отдельных звеньях может быть ветвления на другие цепочки так, что при одних условиях активность продолжается по одной цепи, а в других условиях - по другим цепям. Это и есть контекст ность выполнения программы в зависимости от условий.

>>чтобы определить значим ость поведенческого контекст а, надо получить предполагаемый результат поведения при данном состоянии среды

С каждым звеном уже закреплена какая-то значим ость - как результат отработки данного звена цепи в определенных условиях. Эта значим ость может быть оценена только осознанным вниманием к данной цепочке. Без осознания значим ость играет разрешительную (положительная значим ость) или запретительную (отрицательная) роль. В случае, если в данных условиях со звеном ассоциирована отрицательная значим ость, то дальнейшая активность цепи прекращается.

Осознанное внимание может сканировать цепочку без выполнения действий (блокируя их) и получать значим ость, в том числе и окончательного звена, прогнозирующего результат действия.

Индивида окружает множество находящихся от него на различном расстоянии объектов живой и неживой природы. Если вычесть из их числа те, которые ему неизвестны, а также те, которые ему не нужны, останутся только те, которые нужны, значимые для него.

Значимость (чего-либо) - мера жизненной необходимости (этого) . И мера вероятности затруднения или прекращения жизни в случае отсутствия, дефицита (этого). Объект обретает актуальную значимость, как только он становится предметом какой-либо потребности. Чем важнее потребность, тем выше значимость ее предмета (объекта).

Значимость (объекта процесса, явления) - качество динамичное : сегодня это мне нужно «позарез», а завтра, быть может, не нужно вовсе. Следовательно, важную роль здесь играет фактор времени. Важен и фактор пространства: если нечто, в принципе подходящее для удовлетворения моей потребности, для меня недосягаемо, значимость этого для меня может снижаться.

Субъективность оценки - существенный ее недостаток: так можно упустить нечто важное из свойств оцениваемого объекта, а это, в свою очередь, создает основания для пренебрежения его собственными, внутренними закономерностями.

Значимость имеет индивидуальный и видовой аспекты: совокупность всех значимых для человечества (т.е. человека как вида) объектов много больше, чем совокупность всех значимых для индивида. При этом у животных индивидная значимость чего-либо почти полностью совпадает с видовой, а у человека - нет: в процессе своего развития наш вид сумел реализовать в широкой мере процесс индивидуализации своих представителей.

Итак, значимость это :

  • особое качество объекта: объекта обязательно в связи с субъектом потребности, т.е. в плане его пригодности для ее удовлетворения;
  • это мера жизненной необходимости (этого). Значимо для живого существа все, посредством чего может быть удовлетворена какая-либо его потребность сейчас или потом;
  • значимость динамична, конкретна, имеет общечеловеческий и индивидуальный масштаб.

Виды значимости. Значимость может быть:

  • первичной (непосредственной) и вторичной (опосредованной) - пища первично значима, а ложка, вилка, тарелка значимы вторично, только вследствие их связи с приемом пищи.
  • условной и безусловной (ситуационной и внеситуационной) -вода для человека (как и любою существа) значима всегда, а некоторые материальные ценности - только при определенных условиях;
  • актуальной и потенциальной - (багаж в пути мешает, но по приезде в пункт назначения необходим);
  • положительной и отрицательной - все то, что способствует удовлетворению наших потребностей, для нас значимо положительно, а все то, что этому препятствует, значимо отрицательно.
  • большой и малой;
  • подлинной и мнимой - при увлечении чем-либо мы придаем значимость тем предметам, которые не являются жизненно необходимыми.

Объекты, необходимые в плане удовлетворения потребностей человека, образуют целые значимостные цепочки, где каждое звено оценивается и само по себе, и в свете целого. Важную роль играют изменения, происходящие с самим человеком, и одно из самых главных - в связи с этапами его жизненного пути. Для ребенка значимо одно, для взрослого - другое.

Выгода - мера значимости объекта или способа взаимодействия с ним с точки зрения степени вероятности удовлетворения потребности. Выгода может иметь большое число характеристик как количественных, так и качественных. Одна из ипостасей выгоды - прибыль.

Значимость (чего-либо) индивид находит (определяет) и переживает Способом выявления значимости является оценка, способом проявления уже найденной благодаря оценке значимости является отношение и связанное с ним поведение: по тому, к чему и как человек относится, можно понять, что именно и в какой мере для него значимо. Оценка - это психический механизм нахождения (определения, выявления) значимости, а отношение - способ пребывания (отражения) значимости в психике (сознании) индивида.

Переживание значимости происходит в форме желания: то чего мы в данный момент хотим, то в данный момент для нас и наиболее значимо. Чем интенсивнее нагие желание (чего-либо), тем это значимее для нас. Желание - одна из форм проявления отношения как способа проявления значимости, и оно же, будучи неотъемлемым компонентом иотребностного цикла, отражает процесс ситуационной актуализации и дезактуализации постоянно имеющейся значимости.

Определение показателей значимости через градиент

Нейронная сеть двойственного функционирования может вычислять градиент функции оценки по входным сигналам и обучаемым параметрам сети.

Показателем значимости параметра при решении q- о примера будем называть величину, которая показывает насколько изменится значение функции оценки решения сетью q- о примера если текущее значение параметра w p заменить на выделенное значение w p . Точно эту величину можно определить произведя замену и вычислив оценку сети. Однако учитывая большое число параметров сети вычисление показателей значимости для всех параметров будет занимать много времени. Для ускорения процедуры оценки параметров значимости вместо точных значений используют различные оценки . Рассмотрим простейшую и наиболее используемую линейную оценку показателей значимости. Разложим функцию оценки в ряд Тейлора с точностью до членов первого порядка:

где H 0 q - значение функции оценки решения q- о примера при w =w. Таким образом показатель значимости p- о параметра при решении q- о примера определяется по следующей формуле:

Показатель значимости (1) может вычисляться для различных объектов. Наиболее часто его вычисляют для обучаемых параметров сети. Однако показатель значимости вида (1) применим и для сигналов. Как уже отмечалось в главе сеть при обратном функционировании всегда вычисляет два вектора градиента - градиент функции оценки по обучаемым параметрам сети и по всем сигналам сети. Если показатель значимости вычисляется для выявления наименее значимого нейрона, то следует вычислять показатель значимости выходного сигнала нейрона. Аналогично, в задаче определения наименее значимого входного сигнала нужно вычислять значимость этого сигнала, а не сумму значимостей весов связей, на которые этот сигнал подается.

Усреднение по обучающему множеству

Показатель значимости параметра X q p зависит от точки в пространстве параметров, в которой он вычислен и от примера из обучающего множества. Существует два принципиально разных подхода для получения показателя значимости параметра, не зависящего от примера. При первом подходе считается, что в обучающей выборке заключена полная информация о всех возможных примерах. В этом случае, под показателем значимости понимают величину, которая показывает насколько изменится значение функции оценки по обучающему множеству, если текущее значение параметра w p заменить на выделенное значение w p . Эта величина вычисляется по следующей формуле:

В рамках другого подхода обучающее множество рассматривают как случайную выборку в пространстве входных параметров. В этом случае показателем значимости по всему обучающему множеству будет служить результат некоторого усреднения по обучающей выборке.

Существует множество способов усреднения. Рассмотрим два из них. Если в результате усреднения показатель значимости должен давать среднюю значимость, то такой показатель вычисляется по следующей формуле:

Если в результате усреднения показатель значимости должен давать величину, которую не превосходят показатели значимости по отдельным примерам (значимость этого параметра по отдельному примеру не больше чем О§ p), то такой показатель вычисляется по следующей формуле:

Накопление показателей значимости

Все показатели значимости зависят от точки в пространстве параметров сети, в которой они вычислены, и могут сильно изменяться при переходе от одной точки к другой. Для показателей значимости, вычисленных с использованием градиента эта зависимость еще сильнее, поскольку при обучении по методу наискорейшего спуска (см. раздел ) в двух соседних точках пространства параметров, в которых вычислялся градиент, градиенты ортогональны. Для снятия зависимости от точки пространства используются показатели значимости, вычисленные в нескольких точках. Далее они усредняются по формулам аналогичным (3) и (4). Вопрос о выборе точек в пространстве параметров в которых вычислять показатели значимости обычно решается просто. В ходе нескольких шагов обучения по любому из градиентных методов при каждом вычислении градиента вычисляются и показатели значимости. Число шагов обучения, в ходе которых накапливаются показатели значимости, должно быть не слишком большим, поскольку при большом числе шагов обучения первые вычисленные показатели значимости теряют смысл, особенно при использовании усреднения по формуле (4).

Из анализа литературы и опыта работы группы НейроКомп можно сформулировать следующие задачи, решаемые с помощью контрастирования нейронных сетей.

1. Упрощение архитектуры нейронной сети.

2. Уменьшение числа входных сигналов.

3. Сведение параметров нейронной сети к небольшому набору выделенных значений.

4. Снижение требований к точности входных сигналов.

5. Получение явных знаний из данных.

Алгоритмы контрастирования, рассматриваемые в данной главе, позволяют выделить минимально необходимое множество входных сигналов. Использование минимального набора входных сигналов позволяет более экономично организовать работу нейркомпьютера. Однако у минимального множества есть свои недостатки. Поскольку множество минимально, то информация, несомая одним из сигналов, как правило не подкрепляется другими входными сигналами. Это приводит к тому, что при ошибке в одном входном сигнале сеть ошибается с большой степенью вероятности. При избыточном наборе входных сигналов этого как правило не происходит, поскольку информация каждого сигнала подкрепляется (дублируется) другими сигналами.

Таким образом возникает противоречие - использование исходного избыточного множества сигналов неэкономично, а использование минимального набора сигналов приводит к повышению риска ошибок. В этой ситуации правильным является компромиссное решение - необходимо найти такое минимальное множество, в котором вся информация дублируется. В данном разделе рассматриваются методы построения таких множеств, повышенной надежности. Кроме того, построение дублей второго рода позволяет установить какие из входных сигналов не имеют дублей в исходном множестве сигналов. Попадание такого «уникального» сигнала в минимальное множество является сигналом о том, что при использовании нейронной сети для решения данной задачи следует внимательно следить за правильностью значения этого сигнала.

Существует два типа процедуры контрастирования - контрастирование по значимости параметров и не ухудшающее контрастирование. В данном разделе описаны оба типа процедуры контрастирования.

В данном разделе описан способ определения показателей значимости параметров и сигналов. Далее будем говорить об определении значимости параметров. Показатели значимости сигналов сети определяются по тем же формулам с заменой параметров на сигналы.

Как вы думаете, что делает вашу «вторую половинку» особенной, значимой? Это связано с ее (его) личностью или с вашими чувствами, которые вы испытываете к этому человеку? А может, с простым фактом, что гипотеза о случайности вашей симпатии, как показывают исследования, имеет вероятность менее 5%? Если считать последнее утверждение достоверным, то успешных сайтов знакомств не существовало бы в принципе:

Когда вы проводите сплит-тестирование или любой другой анализ вашего сайта, неверное понимание «статистической значимости» может привести к неправильной интерпретации результатов и, следовательно, ошибочным действиям в процессе оптимизации конверсии. Это справедливо и для тысяч других статистических тестов, проводимых ежедневно в любой существующей отрасли.

Чтобы разобраться, что же такое «статистическая значимость», необходимо погрузиться в историю появления этого термина, познать его истинный смысл и понять, как это «новое» старое понимание поможет вам верно трактовать результаты своих исследований.

Немного истории

Хотя человечество использует статистику для решения тех или иных задач уже много веков, современное понимание статистической значимости, проверки гипотез, рандомизации и даже дизайна экспериментов (Design of Experiments (DOE) начало формироваться только в начале 20-го столетия и неразрывно связано с именем сэра Рональда Фишера (Sir Ronald Fisher, 1890-1962):

Рональд Фишер был эволюционным биологом и статистиком, который имел особую страсть к изучению эволюции и естественного отбора в животном и растительном мире. В течение своей прославленной карьеры он разработал и популяризировал множество полезных статистических инструментов, которыми мы пользуемся до сих пор.

Фишер использовал разработанные им методики, чтобы объяснить такие процессы в биологии, как доминирование, мутации и генетические отклонения. Те же инструменты мы можем применить сегодня для оптимизации и улучшения контента веб-ресурсов. Тот факт, что эти средства анализа могут быть задействованы для работы с предметами, которых на момент их создания даже не существовало, кажется довольно удивительным. Столь же удивительно, что раньше сложнейшие вычисления люди выполняли без калькуляторов или компьютеров.

Для описания результатов статистического эксперимента как имеющих высокую вероятность оказаться истиной Фишер использовал слово «значимость» (от англ. significance).

Также одной из наиболее интересных разработок Фишера можно назвать гипотезу «сексуального сына». Согласно этой теории, женщины отдают свое предпочтение неразборчивым в половых связях мужчинам (гулящим), потому что это позволит рожденным от этих мужчин сыновьям иметь такую же предрасположенность и произвести на свет больше своих отпрысков (обращаем внимание, что это всего лишь теория).

Но никто, даже гениальные ученые, не застрахованы от совершения ошибок. Огрехи Фишера досаждают специалистам и по сей день. Но помните слова Альберта Эйнштейна: «Кто никогда не ошибался, тот не создавал ничего нового».

Прежде чем перейти к следующему пункту, запомните: статистическая значимость — это ситуация, когда разница в результатах при проведении тестирования настолько велика, что эту разницу нельзя объяснить влиянием случайных факторов.

Какова ваша гипотеза?

Чтобы понять, что значит «статистическая значимость», сначала нужно разобраться с тем, что такое «проверка гипотез», поскольку два этих термина тесно переплетаются.
Гипотеза — это всего лишь теория. Как только вы разработаете какую-либо теорию, вам будет необходимо установить порядок сбора достаточного количества доказательств и, собственно, собрать эти доказательства. Существует два типа гипотез.

Яблоки или апельсины — что лучше?

Нулевая гипотеза

Как правило, именно в этом месте многие испытывают трудности. Нужно иметь в виду, что нулевая гипотеза — это не то, что нужно доказать, как, например, вы доказываете, что определенное изменение на сайте приведет к повышению конверсии, а наоборот. Нулевая гипотеза — это теория, которая гласит, что при внесении каких-либо изменений на сайт ничего не произойдет. И цель исследователя — опровергнуть эту теорию, а не доказать.

Если обратиться к опыту раскрытия преступлений, где следователи также строят гипотезы в отношении того, кто является преступником, нулевая гипотеза принимает вид так называемой презумпции невиновности, концепта, согласно которому обвиняемый считается невиновным до тех пор, пока его вина не будет доказана в суде.

Если нулевая гипотеза заключается в том, что два объекта равны в своих свойствах, а вы пытаетесь доказать, что один из них все же лучше (например, A лучше B), вам нужно отказаться от нулевой гипотезы в пользу альтернативной. Например, вы сравниваете между собой тот или иной инструмент для оптимизации конверсии. В нулевой гипотезе они оба оказывают на объект воздействия одинаковый эффект (или не оказывают никакого эффекта). В альтернативной — эффект от одного из них лучше.

Ваша альтернативная гипотеза может содержать числовое значение, например, B - A > 20%. В таком случае нулевая гипотеза и альтернативная могут принять следующий вид:

Другое название для альтернативной гипотезы — это исследовательская гипотеза, поскольку исследователь всегда заинтересован в доказательстве именно этой гипотезы.

Статистическая значимость и значение «p»

Вновь вернемся к Рональду Фишеру и его понятию о статистической значимости.

Теперь, когда у вас есть нулевая гипотеза и альтернативная, как вы можете доказать одно и опровергнуть другое?

Поскольку статистические данные по самой своей природе предполагают изучение определенной совокупности (выборки), вы никогда не можете быть на 100% уверены в полученных результатах. Наглядный пример: зачастую результаты выборов расходятся с результатами предварительных опросов и даже эксит-пулов.

Доктор Фишер хотел создать определитель (dividing line), который позволял бы понять, удался ли ваш эксперимент или нет. Так и появился индекс достоверности. Достоверность — это тот уровень, который мы принимаем для того, чтобы сказать, что мы считаем «значимым», а что нет. Если «p», индекс достоверности, равен 0,05 или меньше, то результаты достоверны.

Не волнуйтесь, в действительности все не так запутано, как кажется.

Распределение вероятностей Гаусса. По краям — менее вероятные значения переменной, в центре — наиболее вероятные. P-показатель (закрашенная зеленым область) — это вероятность наблюдаемого результата, возникающего случайно.

Нормальное распределение вероятностей (распределение Гаусса) — это представление всех возможных значений некой переменной на графике (на рисунке выше) и их частот. Если вы проведете свое исследование правильно, а затем расположите все полученные ответы на графике, вы получите именно такое распределение. Согласно нормальному распределению, вы получите большой процент похожих ответов, а оставшиеся варианты разместятся по краям графика (так называемые «хвосты»). Такое распределение величин часто встречается в природе, поэтому оно и носит название «нормального».

Используя уравнение на основе вашей выборки и результатов теста, вы можете вычислить то, что называется «тестовой статистикой», которая укажет, насколько отклонились полученные результаты. Она также подскажет, насколько близко вы к тому, чтобы нулевая гипотеза оказалась верной.

Чтобы не забивать свою голову, используйте онлайн-калькуляторы для вычисления статистической значимости:

Один из примеров таких калькуляторов

Буква «p» обозначает вероятность того, что нулевая гипотеза верна. Если число будет небольшим, это укажет на разницу между тестовыми группами, тогда как нулевая гипотеза будет заключаться в том, что они одинаковы. Графически это будет выглядеть так, что ваша тестовая статистика окажется ближе к одному из хвостов вашего колоколообразного распределения.

Доктор Фишер решил установить порог достоверности результатов на уровне p ≤ 0,05. Однако и это утверждение спорное, поскольку приводит к двум затруднениям:

1. Во-первых, тот факт, что вы доказали несостоятельность нулевой гипотезы, не означает, что вы доказали альтернативную гипотезу. Вся эта значимость всего лишь значит, что вы не можете доказать ни A, ни B.

2. Во-вторых, если p-показатель будет равен 0,049, это будет означать, что вероятность нулевой гипотезы составит 4,9%. Это может означать, что в одно и то же время результаты ваших тестов могут быть одновременно и достоверными, и ошибочными.

Вы можете использовать p-показатель, а можете отказаться от него, но тогда вам будет необходимо в каждом отдельном случае высчитывать вероятность осуществления нулевой гипотезы и решать, достаточно ли она большая, чтобы не вносить тех изменений, которые вы планировали и тестировали.

Наиболее распространенный сценарий проведения статистического теста сегодня — это установление порога значимости p ≤ 0,05 до запуска самого теста. Только не забудьте внимательно изучить p-значение при проверке результатов.

Ошибки 1 и 2

Прошло так много времени, что ошибки, которые могут возникнуть при использовании показателя статистической значимости, даже получили собственные имена.

Ошибка 1 (Type 1 Errors)

Как было упомянуто выше, p-значение, равное 0,05, означает: вероятность того, что нулевая гипотеза окажется верной, равняется 5%. Если вы откажетесь от нее, вы совершите ошибку под номером 1. Результаты говорят, что ваш новый веб-сайт повысил показатели конверсии, но существует 5%-ная вероятность, что это не так.

Ошибка 2 (Type 2 Errors)

Эта ошибка является противоположной ошибке 1: вы принимаете нулевую гипотезу, в то время как она является ложной. К примеру, результаты тестов говорят вам, что внесенные изменения в сайт не принесли никаких улучшений, тогда как изменения были. Как итог: вы упускаете возможность повысить свои показатели.

Такая ошибка распространена в тестах с недостаточным размером выборки, поэтому помните: чем больше выборка, тем достовернее результат.

Заключение

Пожалуй, ни один термин среди исследователей не пользуется такой популярностью, как статистическая значимость. Когда результаты тестов не признаются статистически значимыми, последствия бывают самые разные: от роста показателя конверсии до краха компании.

И раз уж маркетологи используют этот термин при оптимизации своих ресурсов, нужно знать, что же он означает на самом деле. Условия проведения тестов могут меняться, но размер выборки и критерий успеха важен всегда. Помните об этом.

vanillamuss.ru - Женский портал - Vanillamuss