12. Проверка статистических гипотез
Продолжаем проверять статистические гипотезы – всё новые и новые, новые и новые, до полного насыщения! Исправляя оплошность (запамятовал), хочу порекомендовать эту увлекательную тему в качестве основного или дополнительного материала для вашего научного проекта (курсовика, диплома, диссертации) или прикладного исследования. Причём, самому широкому кругу читателей, в том числе экономистам, социологам, психологам – всем, кто работает со статистическими данными. Здесь и научная новизна, и практическая значимость, и широкий простор для творчества! И несложные вычисления, что немаловажно. ! И сразу дисклеймер предупреждение: в рамках сайта я рассматриваю лишь учебные задачи, поэтому при выборе статических методов для серьёзного научного труда лучше обратиться к другим источникам.
Как вы знаете (а если нет, то ссылка выше), все статистические гипотезы делятся на два вида:
I) Гипотеза о законе распределения статистической совокупности. Этому виду гипотез посвящен следующий урок – Критерий согласия Пирсона.
II) Вторая большая группа гипотез касается числовых характеристик стат. совокупностей, закон распределения которых уже известен:
– Гипотеза о генеральной средней нормального распределения – именно с неё мы и начали разминку;
– Гипотеза о равенстве генеральных средних двух распределений – 4 случая, все разберём!
– Гипотеза о генеральной дисперсии нормального распределения;
– Гипотеза о равенстве ген. дисперсий двух нормальных распределений;
– Гипотеза о вероятности события;
– Сравнение вероятностей двух биномиальных распределений.
Существуют и другие статистические гипотезы, с которыми можно ознакомиться, например, в учебном пособии В. Е. Гмурмана (поздние издания). Кроме того, в курсе корреляционно-регрессионного анализа я рассмотрю статистические гипотезы о значимости линейного коэффициента корреляции, коэффициентов уравнения регрессии и самого уравнения (коэффициента детерминации).
Вникаем, решаем и получаем удовольствие!
Гипотеза о равенстве генеральных средних двух распределений
Постановка задачи: из двух генеральных совокупностей извлечены выборки объёмов
и
и найдены их выборочные средние:
и
соответственно. Требуется на уровне значимости
проверить гипотезу
о равенстве генеральных средних против одной из следующих конкурирующих гипотез:
,
или
. Как и в гипотезе о значении генеральной средней, в первом случае строится левосторонняя критическая область, во втором – правосторонняя и в третьем – двусторонняя.
При этом возможны следующие вариации задачи:
а) выборки независимы, генеральные совокупности распределены нормально и известны их дисперсии
.
Тогда для проверки нулевой гипотезы используют статистический критерий
, где
– случайные значения выборочных средних
Критическая область однозначно определяется критическим значением
, которое отыскивается из соотношения
для односторонней области и
– для двусторонней, где
– выбранный уровень значимости, а
– функция Лапласа. Не поленюсь и снова нарисую все три случая, критическая область изображена красным цветом:

Далее на основании выборочных данных рассчитывается наблюдаемое значение критерия:

Если
в критическую область НЕ попадает, то гипотезу
на уровне значимости
принимаем. Если же попадает, то нулевая гипотеза отвергается в пользу альтернативной гипотезы
.
Пример 40
По выборке объема
найден средний вес изделий
г изделий, изготовленных на первом станке; по выборке объема
найден средний вес изделий
г изделий, изготовленных на втором станке. Известны генеральные дисперсии
. Требуется на уровне значимости 0,01 проверить нулевую гипотезу
против конкурирующей гипотезы
. Предполагается, что генеральные совокупности распределены нормально, а выборки независимы.
...я, конечно, не знаю, у каких современных станков могут быть такие конские дисперсии, тут, скорее, речь о двух бабулях, которые пекут одинаковые пирожки дедовским методом :) И нужно выяснить, одинаковый ли у них выхлоп или первая бабушка более щедрая.
Решаем: по условию, известны генеральные дисперсии, поэтому для проверки гипотезы о равенстве генеральных средних используем критерий
.
Для конкурирующей гипотезы
строится правостороння критическая область. Критическое значение найдём из соотношения
. По условию,
:

По таблице значений функции Лапласа или с помощью Калькулятора (Пункт 5*) определяем, что этому значению функции соответствует аргумент
. Таким образом, при
нулевая гипотеза принимается, а при
отвергается:

На чистовике эти чертежи выполнять не обязательно – они нужны, чтобы вы лучше видели ситуацию.
По выборочным данным вычислим наблюдаемое значение критерия:

, поэтому на уровне значимости 0,01 гипотезу
отвергаем. Иными словами, выборочные средние
статистически значимо отличаются друг от друга, и это отличие вряд ли объяснимо случайными факторами. А объяснимо оно именно различием генеральных средних.
Но это ещё не значит, что нужно покупать пирожки у «иксовой» бабули, они ведь могут оказаться менее вкусными :)
Ответ: на уровне значимости 0,01 нулевую гипотезу отвергаем.
И еще раз повторим, что это значит. Это значит, что с вероятностью 1% мы совершили ошибку первого рода (отвергли правильную гипотезу).
Следующая задача для самостоятельного решения:
Пример 41
Из продукции двух автоматических линий извлечены по 50 гвоздей и вычислены их выборочные средние длины
и
мм. Нормативная погрешность линий есть нормальная случайная величина с дисперсией
. На уровне значимости 0,05 проверить гипотезу о равенстве генеральных средних
против конкурирующих гипотез: а)
, б)
.
Краткое решение и ответ в конце урока, особую аккуратность проявите в обозначениях – в аналогичных задачах они бывают разными.
Та же гипотеза, другая ситуация:
б) независимые выборки достаточно большие
, генеральные дисперсии неизвестны, причём ген. совокупности могут иметь и другое распределение (не нормальное)
Условие
, к слову, желательно и в предыдущем пункте.
В этом случае можно использовать похожий, но приближенный критерий
, где
– случайные значения выборочных средних, а
– соответствующие выборочные дисперсии.
Исправлением дисперсий тут можно пренебречь (т.к. выборки большие), но лично я бы исправил. Впрочем, результаты такой проверки всё равно будут менее «авторитетными».
Ситуация более тяжелая:
в) это малые независимые выборки
, ген. совокупности распределены нормально и дисперсии их не известны
В этом случае выборочные дисперсии дают плохую оценку генеральных дисперсий, поэтому критерий предыдущего пункта не годится. Но если предположить или доказать, что генеральные дисперсии одинаковы (хотя и не известны), то для проверки гипотезы
можно использовать следующий критерий:
, где
– случайные значения выборочных средних, а
– соответствующие исправленные выборочные дисперсии. Эта случайная величина распределена по закону Стьюдента с
степенями свободы.
Пример 42
Из двух партий деталей, изготовленных одинаковыми станками, извлечены выборки объемами
и
деталей. По результатам исследования найдены
мм,
мм и
мм,
мм. Предполагая, что погрешность изготовления есть нормальная случайная величина, проверить на уровне значимости
гипотезу
против конкурирующей гипотезы
.
В этом тяжелом случае нам удалось раздобыть всего лишь 10 и 15 гвоздей, но ситуацию спасает то, что станки одинаковые, поэтому можно смело допустить, что их погрешности (ген. дисперсии) одинаковы. Кроме того, можно проверить гипотезу о равенстве генеральных дисперсий, до которой мы ещё доберёмся.
Решение: полагая, что генеральные дисперсии одинаковы, используем критерий
.
Поскольку конкурирующая гипотеза имеет вид
, то критическая область двусторонняя. Найдём критическое значение. Для уровня значимости
и числа степеней свободы
по таблице или с помощью Калькулятора (Пункт 10в) определяем:
![]()
При
нулевая гипотеза принимается, а вне этого интервала – отвергается:

Вычислим наблюдаемое значение критерия:

– полученное значение попало в область принятия гипотезы.
Таким различие выборочных средних
статистически не значимо и объяснимо влиянием случайных факторов (погрешностью станков и тем, что в саму выборку попали случайные гвозди).
Ответ: на уровне значимости 0,05 гипотезу
принимаем.
Задача для самостоятельного решения будет в параграфе Гипотеза о равенстве двух генеральных дисперсий, поскольку для того, чтобы пользоваться равенством ген. дисперсий, строго говоря и по меньшей мере, его нужно ещё проверить статистически.
И ещё один случай:
г) ген. совокупности распределены нормально, ген. дисперсии неизвестны, выборки зависимы
Здесь рассматриваются выборки одинакового объёма, варианты которых попарно зависимы. Что это значит? Пример: возьмём 50 помидоров и измерим их диаметр линейкой:
. Затем в том же порядке – штангенциркулем:
. Совершенно понятно, что соответствующие результаты будут хоть чуть-чуть, но различны:
, следовательно, выборочные средние – тоже:
. И возникает вопрос: значимо или незначимо это отличие?
В случае зависимых выборок гипотеза о равенстве генеральных средних сводится к уже разобранной гипотезе о значении генеральной средней. Представим, что описанные выше попарные опыты проводятся много-много раз. Тогда речь заходит о случайной величине
– случайной разнице между случайными значениями
выборочных средних. И мы проверяем гипотезу о том, что генеральная средняя (матожидание) этой разницы равна нулю
против очевидной альтернативы
или
либо
.
Технику решения рассмотрим на конкретном примере, социологическая задача, и никаких гвоздей:
Пример 43
Физическая подготовка 9 спортсменов была проведена при поступлении в спортивную школу, а затем после недели тренировок. Итоги проверки в баллах оказались следующими:

(в 1-й строке число баллов при поступлении, во 2-й – после недели тренировок)
Требуется на уровне значимости 0,05 установить, значимо или незначимо улучшилась физическая подготовка спортсменов, в предположении, что число баллов распределено нормально.
И предположение это небезосновательно, т. к. человеческие характеристики, как правило, распределены нормально.
Решение: проверим гипотезу о том, что матожидание случайной величины
(разницы между случайными средними) равно нулю
против конкурирующей гипотезы
(т.к. улучшение физической формы выражается бОльшим «игрековым» значением и отрицательной разностью).
Так как генеральная дисперсия этой случайной величины не известна, то используем знакомый критерий
, где
– случайная разница между выборочными средними и
– соответствующее исправленное стандартное отклонение. Напоминаю, что этот критерий имеет распределение Стьюдента с количеством степеней свободы
.
Для уровня значимости
и
найдём критическое значение левосторонней критической области (по нижней строке таблицы или на Калькуляторе - Пункт 10в):
![]()
При
нулевую гипотезу принимаем, а при
– отвергаем:

Для нахождения наблюдаемого значения критерия
нужно рассчитать выборочные характеристики. Вычислим разности между вариантами
, их квадраты
и суммы:

Вычислим выборочную среднюю разницу:
![]()
Вычислим исправленное стандартное отклонение, не сторонник я «ускоренных» формул, но здесь она удобна:

Таким образом:
, поэтому на уровне значимости 0,05 нет оснований отвергать гипотезу
.
В данном случае это более удачная формулировка, нежели «гипотезу принимаем».
Таким образом, средняя разница
между вариантами
(физ. форма до тренировки) и соответствующими вариантами
(физ. форма после тренировки) статистически незначима.
Ответ: на уровне значимости 0,05 нет оснований утверждать, что после недельной тренировки физическая форма спортсменов значимо улучшилась.
Продолжаем тему самостоятельно:
Пример 44
Две химические лаборатории исследовали 8 проб на допинг одним и тем же методом. Получены следующие результаты (процент содержания некоторого вещества в соответствующих пробах):

Требуется на уровне значимости 0,05 определить, значимо или незначимо различаются средние результаты анализов, в предположении, что они распределены нормально.
Иными словами, определите, не занесли ли в какую-нибудь лабораторию деньги :)
Как обычно, все числа уже в Экселе; продублирую также ссылки на таблицу критических точек распределению Стьюдента и Калькулятор (Пункт 10в).
С другими гипотезами всё проще:
Гипотеза о генеральной дисперсии нормального распределения
Она по своей сути похожа на гипотезу о генеральной средней: есть основания полагать, что генеральная дисперсия
нормальной совокупности равна некоторому значению
. По результатам выборки объёма
найдена исправленная выборочная дисперсия
и возникает вопрос: она значимо отличается от
или нет? Таким образом, на уровне значимости
требуется проверить гипотезу
– о том, что генеральная дисперсия действительно равна своему гипотетическому значению.
Для проверки этой гипотезы используют критерий
, где
– случайное значение исправленной дисперсии. Данная случайная величина имеет распределение хи-квадрат с количеством степеней свободы
и принимает лишь неотрицательные значения.
Критическая область зависит от вида конкурирующей гипотезы, а критические значения можно определить по соответствующей таблице либо с помощью Калькулятора (Пункт 11б).
1) Для гипотезы
строится левосторонняя область, критическое значение равно
.

2) Для гипотезы
строится правосторонняя область, критическое значение равно
.

3) И для гипотезы
строится двусторонняя критическая область, левая и правая критические точки определяются по формулам
, ![]()

Если наблюдаемое значение критерия
попадает в критическую область, то гипотеза
на уровне значимости
отвергается.
Классическая задача по теме – это задача о точности какого-нибудь прибора, станка или метода измерения:
Пример 45
Допустимая погрешность измерительного прибора по паспорту составляет
. В результате 10 измерений найдено фактическое значение погрешности
. Требуется на уровне значимости 0,05 проверить, соответствуют ли экспериментальный результат заявленной точности прибора.
Или, попросту говоря, не лажает ли этот прибор.
Решение: полагая, что погрешность измерений распределена нормально, проверим гипотезу о том, что генеральная дисперсия действительно равна
против конкурирующей гипотезы
. Это, кстати, самый популярный вид альтернативной гипотезы – когда есть превышение нормы, и требуется проверить, случайно оно или нет.
Используем критерий
, где
– случайное значение исправленной дисперсии.
Найдём правостороннюю критическую область. Для уровня значимости
и количества степеней свободы
по таблице критических точек распределения хи-квадрат или с помощью Калькулятора (Пункт 11б) определяем критическое значение:
![]()
При
нулевая гипотеза принимается, а при
– отвергается:

Вычислим наблюдаемое значение критерия:
, поэтому на уровне значимости 0,05 нет оснований отвергать гипотезу
. Таким образом, выборочный более высокий результат
с большой вероятностью обусловлен случайностью.
Возможно, у вас сложилось впечатление, что значения 5 и 6,2 различаются существенно, но это иллюзия – ведь дисперсия имеет квадратичную размерность, и стандартные отклонения действительно довольно близкИ друг к другу:
.
Ответ: на уровне значимости 0,05 точность прибора соответствует норме.
Самостоятельно:
Пример 46
Партия изделий принимается, если дисперсия контролируемого размера значимо не превышает 0,2. Исправленная выборочная дисперсия, найденная по выборке объема
, оказалась равной
. Можно ли принять партию на уровне значимости 0,05?
Таблица здесь не годится, поэтому пользуемся Калькулятором (Пункт 11б). За неимением Экселя используйте приближенную формулу Уилсона-Гильферти:
, где
отыскивается из соотношения
.
Сейчас для интереса проверил – погрешность составила всего одну сотую!
Гипотеза о равенстве генеральных дисперсий двух нормальных распределений
Две средние мы уже сравнивали, очередь за дисперсиями. Из двух нормальных ген. совокупностей извлечены независимые выборки объёмом
и
и найдены их исправленные дисперсии:
и
соответственно. Совершенно понятно, что эти значения случайны и отличны друг от друга. Но возникает вопрос: значимо или незначимо это отличие? Для ответа на этот вопрос на уровне значимости
проверяется гипотеза о равенстве генеральных дисперсий
. Если она будет принята, то различие между выборочными значениями
объяснимо случайными факторами.
Для проверки этой гипотезы используют критерий
, где
– бОльшая исправленная дисперсия, а
– мЕньшая.
Данная случайная величина имеет распределение Фишера-Снедекора (так называемое F-распределение) со степенями свободы
, если
или
, если
. То есть, степень свободы
соответствует выборке с бОльшей исправленной дисперсией.
В качестве альтернативы рассматривают одну из следующих гипотез:
1)
(если
) либо
(если
). Для этой гипотезы строят правостороннюю критическую область:

Критическое значение
можно найти по таблице критических значений F-распределения, а ещё лучше – с помощью стандартной функции Экселя, используйте тот же Калькулятор (Пункт 12).
2)
– для этой гипотезы строится двусторонняя критическая область:

Однако для решения нашей задачи достаточно найти лишь правое критическое значение
.
Дело в том, что
, и поэтому случайное значение
(бОльшее единицы) заведомо не может попасть в левый кусок критической области.
Далее на основании выборочных данных рассчитывается наблюдаемое значение критерия
, и если оно попадает в критическую область (
для обоих случаев), то гипотеза
отвергается. Если
, то принимается.
Рассматриваемая гипотеза часто возникает, когда требуется сравнить точность двух приборов, инструментов, станков, двух методов исследования. И сейчас мы разберём эту стандартную задачу:
Пример 47
Некоторая физическая величина измерена
и
раз двумя различными способами. По результатам измерений найдены соответствующие погрешности
. Требуется на уровне значимости 0,05 проверить, одинаковую ли точность обеспечивают эти способы измерений.
Ситуации тут могут быть разные: это измерение двумя однотипными инструментами (например, двумя линейками), или инструментами разными (например, линейкой и штангенциркулем), или речь вообще идёт о двух методах измерения (например, с зажмуренным левым и правым глазом).
И возникает вопрос: различие между
случайно или обусловлено тем, что какой-то способ точнее?
Решение: полагая, что погрешности измерений распределены нормально, проверим гипотезу
о том, что точность двух способов одинакова против конкурирующей гипотезы
(она правдоподобнее, нежели
).
Для проверки гипотезы используем критерий
, где
– бОльшая исправленная дисперсия, а
– мЕньшая.
Найдём критическое значение
. Степень свободы
должна соответствовать выборке с бОльшей дисперсией, следовательно,
и
. По соответствующей таблице либо с помощью Калькулятора (Пункт 12) находим:
![]()
При
нулевая гипотеза принимается, а при
(в критической области) – отвергается.
Вычислим наблюдаемое значение критерия:
, поэтому на уровне значимости 0,05 нет оснований отвергать гипотезу
. Иными словами, различие выборочных значений
обусловлено случайными факторами, но прежде всего, малым количеством опытов.
Так, если бы было проведено в 10 раз больше измерений
и получены те же самые погрешности, то
, и гипотеза о равенстве ген. дисперсий уже отвергается. То есть здесь расхождение между
уже нельзя объяснить случайностью, а объяснимо оно именно тем, что второй способ менее точный (справедлива гипотеза
).
Ответ: на уровне значимости 0,05 точность способов измерения одинакова.
Творческая задача для самостоятельного решения, случай из жизни:
Пример 48
Две группы студентов-первокурсников написали контрольную по математическому анализу со следующими результатами:
Предполагая, что успеваемость студентов распределена нормально, на уровне значимости 0,1:
1) Проверить гипотезу
– о том, что группы однородны по составу (в плане соотношения лучше и хуже успевающих студентов) против конкурирующей гипотезы
,
и в случае однородности групп обещанный пунктик:
2) Проверить гипотезу
– об одинаковой успеваемости групп против гипотезы о том, что одна из групп более слабая.
Вспоминаем, что такое дискретный вариационный ряд и как рассчитываются его характеристики. Не позволяй душе лениться! – в жизни пригодится, все числа уже в Экселе.
Ну что, порешаем ещё задачки? …конечно, порешаем! – ведь я маньяк в лучшем смысле этого слова:
Гипотеза о вероятности события
Пусть в достаточно большом количестве
независимых испытаний некоторое случайное событие появилось
раз, и есть основание полагать, что вероятность
появления этого события (в каждом испытании) равна некоторому значению
. Возникает вопрос: значимо или незначимо отличается относительная частота
от этого гипотетического значения?
Для проверки гипотезы
используют критерий
, где
, а
– случайное количество испытаний, в которых событие появилось. При этом для качественного результата должно выполняться неравенство
.
Далее технически всё похоже на гипотезу о генеральной средней. Для конкурирующей гипотезы
строится левосторонняя критическая область, для
– правосторонняя и для
– двусторонняя:

Критическое значение отыскивается из соотношения
для односторонней области и
– для двусторонней, где
– выбранный уровень значимости, а
– функция Лапласа.
Если наблюдаемое значение критерия
попадает в критическую область, то гипотеза
отвергается.
Пример 49
В результате длительных наблюдений установлено, что вероятность полного выздоровления больного, принимавшего лекарство
, равна 0,8. Новое лекарство
назначено 800 больным, причём 660 из них полностью выздоровели. Можно ли считать новое лекарство значимо эффективнее лекарства
на пятипроцентном уровне значимости?
Итак, в результате использования нового лекарство получена относительная частота полного выздоровления
и возникает вопрос: этот результат случаен или лекарство
действительно эффективнее? Проясним эту ситуацию статистическим методом:
Решение: на уровне значимости
проверим гипотезу
о том, что новое лекарство имеет такую же эффективность против конкурирующей гипотезы
, что оно более эффективно. Используем критерий
, где
– случайное количество пациентов из
, которые полностью выздоровеют.
Критическое значение правосторонней критической области найдём из соотношения
, в данном случае

По таблице значений функции Лапласа или с помощью Калькулятора (Пункт 5*), определяем, что этому значению функции соответствует аргумент
.
При
нулевая гипотеза принимает, а при
– отвергается:

Вычислим
и наблюдаемое значение критерия:

, поэтому на уровне значимости 0,05 гипотезу
отвергаем в пользу конкурирующей гипотезы
. Таким образом, выборочный результат
вряд ли объясним случайностью.
Ответ: на пятипроцентном уровне значимости новое лекарство эффективнее лекарства
.
Самостоятельно:
Пример 50
Завод рассылает рекламные каталоги возможным заказчикам. Как показал опыт, вероятность того, что организация, получившая каталог, закажет рекламируемое изделие, равна 0,08. Завод разослал 1000 каталогов новой улучшенной формы и получил 98 заказов. Можно ли считать, что новая форма рекламы значимо эффективнее?
Примите уровень значимости
и проверьте это предположение.
И заключительный параграф этой интереснейшей статьи:
Сравнение вероятностей двух биномиальных распределений
На самом деле о вероятности биномиального распределения речь уже шла в предыдущей гипотезе, и теперь перед нами стоит задача сравнить вероятности двух биномиальных распределений.
Пусть в двух генеральных совокупностях проводятся независимые испытания, в каждом из которых событие
может появиться – с неизвестной вероятностью
в первой совокупности и с неизвестной вероятностью
– во второй. По выборочным сериям испытаний объёмами
и
найдены соответствующие относительные частоты:
, где
– фактическое число появлений события
в 1-й и во 2-й выборке.
Требуется оценить, значимо или незначимо отличаются друг от друга относительные частоты. Незначимое отличие объяснимо случайными факторами и справедливостью гипотезы
.
Для проверки этой гипотезы используют критерий:
, где
– случайное количество появлений события
в 1-й и во 2-й выборке соответственно.
В качестве альтернативы рассматривают гипотезу
либо
. Критические области строятся точно так же, как и в предыдущем пункте! Кстати, почему здесь можно использовать лапласовские соотношения? А дело в том (кто помнит), что при достаточно большой выборке биномиальное распределение близкО к нормальному.
Возвращаемся к нашим помидорам:
Пример 51
От двух поставщиков в магазин поступило
и
однотипных изделий. В первой партии оказалось
бракованных изделий, а во второй –
. Требуется на уровне значимости 0,05 оценить, одинаково ли хороши поставщики.
Очевидно, что здесь существуют вполне конкретные вероятности
– того, что магазин получит бракованное изделие от 1-го и 2-го поставщика соответственно. И эти вероятности нам не известны. Однако в нашем распоряжении есть выборочные данные – относительные частоты:
![]()
И возникает вопрос: эта разница случайна или нет?
Решение: на уровне значимости
проверим гипотезу
о том, что поставщики равноценны против конкурирующей гипотезы
.
Критическое значение двусторонней критической области найдём из соотношения
. В данном случае:

По таблице значений функции Лапласа или с помощью Калькулятора (Пункт 5*) определяем
. При
нулевая гипотеза принимается, а при
– отвергается:

Вычислим наблюдаемое значение критерия:

– полученное значение попало в область принятия гипотезы
, таким образом, различие относительных частот
, скорее всего, случайно.
Ответ: на уровне значимости 0,05 нет оснований отдавать предпочтение какому-то одному из поставщиков
Как говорится, что там помидоры, что там.
И почётное право завершить этот урок предоставляется героям, которые помогали нам на протяжении всего курса тервера, ну а может и некоторые читатели уже взялись за оружие:))
Пример 52
Два стрелка совершили по 50 выстрелов в цель. Первый стрелок поразил цель 41 раз, а второй – 36. Можно ли на уровне значимости 0,1 утверждать, что первый стрелок более меткий?
Решение и ответ совсем близко.
Но и это ещё не всё! На очереди важнейшая и очень распространённая гипотеза о законе распределения генеральной совокупности.
До скорых встреч!
Решения и ответы:
Пример 41. Решение: по условию, известны генеральные дисперсии, поэтому для проверки гипотезы используем критерий
.
а) Для гипотезы
строим левостороннюю критическую область. Критическое значение найдём из соотношения
. Для уровня значимости
:

По таблице значений функции Лапласа определяем
. Таким образом, при
нулевую гипотезу принимаем, а при
(в критической области) – отвергаем:

Вычислим наблюдаемое значение критерия:

, поэтому на уровне значимости 0,05 нулевую гипотезу принимаем.
б) Для гипотезы
строим двустороннюю критическую область:

Критическое значение найдём из соотношения
:

Наблюдаемое значение критерия
попало в область принятия гипотезы
, поэтому на уровне значимости 0,05 нулевую гипотезу принимаем.
Ответ: в обоих случаях гипотезу
принимаем.
Напоминаю, что это не 100%-ное доказательство гипотезы, т.к. существует
-вероятность того, что мы приняли неверную гипотезу (совершили ошибку второго рода).
Пример 44. Решение: рассмотрим случайную величину
, где
– случайные значения выборочных средних, и проверим гипотезу
против конкурирующей гипотезы
. Поскольку генеральная дисперсия этой случайной величины не известна, то используем критерий
, распределённый по закону Стьюдента с количеством степеней свободы
.
Для уровня значимости
и
по таблице критических точек распределения Стьюдента находим критическое значение для двусторонней критической области:
![]()
Таким образом, при
нулевую гипотезу принимаем, и вне этого интервала (в критической области) отвергаем:

Найдём наблюдаемое значение критерия. Для этого нужно вычислить выборочную среднюю разницу
между выборочными средними
и
и соответствующую дисперсию
. Заполним расчётную таблицу:

Таким образом:

Наблюдаемое значение критерия:
– полученное значение попало в критическую область, поэтому на уровне значимости 0,05 гипотезу
отвергаем.
Ответ: на уровне значимости 0,05 результаты лабораторий отличны друг от друга.
Пример 46. Решение: полагая, что погрешности размера выпускаемых изделий распределены нормально, проверим гипотезу
против конкурирующей гипотезы
. Используем критерий
.
Так как в конкурирующей гипотезе речь идёт о бОльших значениях дисперсии, то критическая область будет правосторонней. Найдём критическое значение. Для уровня значимости
и количества степеней свободы
с помощью MS Excel находим критическое значение:
![]()
При
нулевая гипотеза принимается, а при
– отвергается.
Вычислим наблюдаемое значение критерия:
, поэтому на уровне значимости 0,05 гипотезу
отвергаем.
Иными словами, выборочный результат
статистически значимо отличается от нормативного значения 0,2, и оборудование, на котором производятся изделия, нуждается в регулировке. Скорее всего.
Ответ: на уровне значимости 0,05 партию изделий принять нельзя.
Пример 48. Решение: Заполним расчётную таблицу:

Вычислим выборочные характеристики. Средний балл:
![]()
Выборочные дисперсии:

Исправленные дисперсии:
![]()
1) На уровне значимости 0,1 проверим гипотезу
против конкурирующей гипотезы
. Используем критерий
, где
– бОльшая исправленная дисперсия, а
– меньшая.
Найдём правое критическое значение двусторонней критической области. Для уровня значимости
и числа степеней свободы
с помощью MS Excel находим:
![]()
Вычислим наблюдаемое значение критерия:
, поэтому на уровне значимости 0,1 гипотезу
принимаем. Таким образом, группы однородны (в плане соотношения лучше и хуже успевающих студентов).
Замечание: здесь, конечно, речь идёт не о строгом, а о примерном равенстве генеральных дисперсий.
2) На уровне значимости 0,1 проверим гипотезу
против гипотезы
о том, что 1-я группа учится слабее. Исследуемые совокупности достаточно малы
и их генеральные дисперсии неизвестны, но в предыдущем пункте статистически обосновано незначимое различие ген. дисперсий. Поэтому для проверки гипотезы можно использовать критерий
, где
– случайные значения выборочных средних, а
– соответствующие исправленные выборочные дисперсии.
Поскольку конкурирующая гипотеза имеет вид
, то критическая область будет левосторонней. Для уровня значимости
и числа степеней свободы
найдём критическое значение односторонней области:
(Калькулятор - Пункт 10в)
При
нулевая гипотеза отвергается, а при
– принимается:

Вычислим наблюдаемое значение критерия:

, поэтому на уровне значимости 0,1 нет оснований отвергать гипотезу
.
Таким образом, по результатам контрольной работы нельзя утверждать, что различие между средними оценками
обусловлено тем, что 1-я группа более слабая. Для проверки этого предположения требуется дальнейший мониторинг за успеваемостью.
Ответ: на уровне значимости 0,1 нет оснований отвергнуть нулевые гипотезы.
Пример 50. Решение: на уровне значимости
проверим гипотезу
о том, новая рекламная кампания имеет такую же эффективность против конкурирующей гипотезы
. Используем критерий
, где
, а
– случайное кол-во заказов, которое может поступить в результате рассылки 1000 новых каталогов.
Найдём критическое значение правосторонней критической области:
, по таблице значений функции Лапласа определяем
. При
нулевую гипотезу принимаем, а при
– отвергаем.
Вычислим наблюдаемое значение критерия:

, поэтому на уровне значимости
гипотезу
отвергаем.
Ответ: на уровне значимости 0,05 новая форма рекламы значимо эффективнее.
Пример 52. Решение: на уровне значимости
проверим гипотезу
против гипотезы
о том, что 1-й стрелок стреляет точнее.
Найдём критическое значение правосторонней критической области:

При
нулевую гипотезу принимаем, а при
– отвергаем.
Вычислим наблюдаемое значение критерия:

, следовательно, на уровне значимости 0,1 нет оснований отвергать гипотезу
.
Ответ: на уровне значимости 0,1 нет оснований считать, что 1-й стрелок более меткий.
Автор: Емелин Александр
Высшая математика для заочников и не только >>>
(Переход на главную страницу)
Высшая математика – просто и доступно!
Наш форум, библиотека и блог:


Повторяем школьный курс
Карта сайта



© Copyright