Критерий Пирсона или
критерий c2 (хи - квадрат) имеет наибольшее применение при
проверке согласования теоретической и эмпирических кривых распределения.
Наблюдаемое значение критерия
вычисляется по
следующей формуле:
, (3.31)
где
- эмпирическая частота
i-го интервала (варианта);
- теоретическая
частота i-го интервала (варианта);
ℓ- число интервалов (вариантов).
Как известно, c2 - распределение зависит от числа степеней свободы, это число находится по формуле:
,
(3.32)
где r - число неизвестных параметров предполагаемого теоретического закона, использованных для вычисления теоретических частот и оцениваемых по выборке.
По теоретическим
соображениям при расчете
не следует исходить из
слишком малых значений
. Поэтому рекомендуется объединять соседние интервалы
(варианты) таким образом, чтобы
> (5
10) для объединенных интервалов. Кроме того, объем выборки должен
быть достаточно велик (n ³ 50) и
.
В случае нормального закона
распределения расчет теоретической кривой распределения j(x)
производится при условии, что статистические характеристики
приравниваем числовым
характеристикам нормального закона (m; s), поэтому r = 2 и число степеней свободы n =
-3.
Вероятности попадания случайной величины X в соответствующие интервалы вычисляется по интегральной теореме Лапласа:
, (3.33)
где
;
.
В случае биномиального
закона распределения расчет теоретической кривой распределения производится при
условии, что статистическая доля (частость) приравнивается вероятности p появления интересующего нас события А, поэтому r = 1 и число степеней свободы n =
-2.
Вероятность pi того, что случайная величина X принимает значение xi = m, где
, определяется по формуле Бернулли:
, (3.34)
где
- средняя частость
проявления появления события во всех k выборках;
n - число испытаний в каждой выборке.
В случае закона Пуассона
расчет теоретической кривой распределения производится при условии, что средняя
интенсивность
приравнивается математическому
ожиданию M(x), поэтому r = 1 и n =
-2.
Вероятность pi того, что случайная величина X принимает значение xi = m, определяется по формуле Пуассона:
, (3.35)
где
- средняя
интенсивность.
mi - частота появления значения хi; i=1, 2, ... , к.
При проверке гипотез о виде законов распределения могут быть использованы и другие критерии согласия: Колмогорова, Романовского, Ястремского и др.
Пример 3.5. По данным таблицы рассчитать теоретические частоты в предположении нормального закона распределения; результаты вычислений приводятся в следующей таблице.
|
Интервалы |
3,65-3,75 |
3,75-3,85 |
3,85-3,95 |
3,95-4,05 |
4,05-4,15 |
4,15-4,25 |
4,25-4,35 |
|
|
1 |
6 |
11 |
15 |
9 |
6 |
2 |
|
|
2 |
5 |
11 |
14 |
11 |
5 |
2 |
На уровне значимости 0,05 проверить гипотезу о нормальном законе распределения.
Решение. Вычисляем наблюдаемое значение критерия
по формуле (3.31). Результаты
вычислений представим в виде таблицы.
|
Интервалы |
|
|
|
|
|
3,65-3,75
3,75-3,85 |
|
|
0 |
0 |
|
3,85-3,95 |
11 |
11 |
0 |
0 |
|
3,95-4,05 |
15 |
14 |
1 |
|
|
4,05-4,15 |
9 |
11 |
4 |
|
|
4,15-4,25
4,25-4,35 |
|
|
1 |
|
|
å |
50 |
50 |
- |
|
По таблице c2 - распределения на уровне значимости 0,05 и числе
степеней свободы n =
-3 = 5 - 3 = 2 определим
= 5,991. Так как
= 0,578 <
= 5,991, нулевая гипотеза H0 не отвергается, т.е.
производительность труда для данной совокупности подчиняется нормальному закону
распределения.
Пример 3.6. Даны следующие числа рождения мальчиков у 50 матерей, родивших четыре раза:
|
3 |
1 |
0 |
2 |
1 |
2 |
1 |
3 |
3 |
3 |
|
2 |
3 |
2 |
2 |
1 |
2 |
1 |
3 |
2 |
3 |
|
3 |
0 |
1 |
1 |
2 |
2 |
1 |
0 |
3 |
2 |
|
0 |
2 |
2 |
2 |
3 |
3 |
2 |
4 |
3 |
3 |
|
2 |
1 |
1 |
2 |
2 |
3 |
3 |
2 |
3 |
4 |
Проверить на уровне 0,01 гипотезу о биноминальном законе распределения.
Решение. Всего 50 матерей родили N = k×n = 50×4 = 200 детей. Случайной величиной X является число мальчиков в семьях из 4 детей. Построим вариационный ряд:
|
xi |
0 |
1 |
2 |
3 |
4 |
å |
|
|
4 |
10 |
18 |
16 |
2 |
50 |
Эмпирическими частотами
являются числа
матерей, родивших определенное число мальчиков.
Рассчитаем среднюю частоту рождения мальчика:
.
По формуле (3.34) вычислим вероятности комбинаций рождения мальчика (и девочки) в семьях из 4 детей:
m = 0;
;
m = 1;
;
m = 2;
;
m = 3;
;
m = 4;
.
Итого:
.
Теоретические частоты равны
= k×pi. Рассчитаем наблюдаемое значение критерия
.
|
xi |
|
|
|
|
|
0
1 |
|
|
1 |
|
|
2 |
18 |
19 |
1 |
|
|
3
4 |
|
|
1 |
|
|
å |
50 |
50 |
- |
|
По таблице c2 - распределения на уровне значимости a = 0,01 и при числе степеней свободы n =
-2 = 3 - 2 = 1 определяем
= 6,635.
Так как
= 0,370 <
= 6,635, нулевая гипотеза не отвергается, т.е. число мальчиков
в семье из 4 детей данной совокупности подчиняется биноминальному закону
распределения.
Пример 3.7. Число рабочих, не выполнивших сменного задания в 100 выборках по 20 рабочих, приводится в таблице:
|
Число рабочих xi |
0
|
1 |
2 |
3 |
4 |
|
Число выборок mi |
85 |
11 |
3 |
1 |
0 |
На уровне значимости 0,05 проверить гипотезу о законе Пуассона.
Решение. Определяем среднюю интенсивность числа рабочих, не выполнивших сменного задания, на одну выборку:

По таблице
определяем
.
По формуле (3.35) вычисляем вероятности:
;
;
;
.
Вычисляем наблюдаемое значение критерия:
|
xi |
|
|
|
|
|
0 |
85
|
82 |
9 |
|
|
1 |
11 |
16 |
25 |
|
|
2
3 |
|
|
4 |
|
|
å |
100 |
100 |
- |
|
По таблице c2 - распределения на уровне
значимости 0,05 и при числе степеней свободы n = l-2
= 3 - 2 = 1 определяем
= 12,706.
Так как
(= 3,671) <
(= 12,706), нулевая гипотеза H0 не
отвергается, т.е. число рабочих, не выполнивших сменного задания, подчиняется закону
Пуассона.
Таблица 3.1
Основные формулы, используемые при проверке гипотез о значении параметров распределений
|
№ пп |
H0 |
Условия проверки |
Используемое распределение |
Формулы для вычисления наблюдаемого значения параметров |
H1 |
Порядок определения критического значения критериев |
Правила проверки |
|
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
|
|
|
s2 |
Ф(t) |
|
m1<m0; m1>m0 |
(1-2a)®tкр |
отвергается |
|
|
|
известна
|
|
|
m1¹m0 |
(1-a)®tкр |
с вероятностью ошибки a |
|
1 |
m=m0
|
s2не |
S(t) |
|
m1<m0; m1>m0 |
|
|
|
|
|
известна
|
|
|
m1¹m0 |
|
|
|
|
|
|
Ф(t) |
|
mx<my; mx>my |
(1-2a)®tкр |
не отвергается |
|
2 |
mX=mY |
известны
|
|
|
mx¹my
|
(1-a)®tкр
|
|
|
|
|
известны, но |
S(t) |
|
mx<my; mx>my |
|
|
|
|
|
|
|
|
mx¹my |
|
|
|
|
|
|
|
|
|
|
не отвергается
|
|
3 |
|
|
c2 |
|
|
|
® H0 не отвергается
При или
® H0 отвергается |
|
|
|
|
|
|
|
|
не отвергается |
|
4 |
|
|
F |
|
|
|
не отвергается |
|
5 |
|
n1 ¹ n2 ¹ ... ... ¹ ni > 4 |
c2 |
|
|
|
не отвергается |
|
|
|
n1 = n2 = ... ... = |
G |
|
|
|
не отвергается |
|
6 |
p1 = p2 = ... = p |
n ®¥ |
c2 |
|
|
|
не отвергается |
Тест
1. Что называют ошибкой первого рода:
а) Гипотеза H0 верна и ее принимают согласно критерию;
б) Гипотеза H0 верна и ее отвергают согласно критерию;
в) Гипотеза H0 не верна и ее отвергают согласно критерию;
г) Гипотеза H0 не верна и ее принимают согласно критерию.
2. Что называют мощностью критерия:
а) Вероятность, с которой статистика критерия должна попасть в критическую область, если верна гипотеза H0;
б) Вероятность, с которой статистика критерия должна попасть в критическую область, если верна гипотеза H1;
в) Вероятность, с которой статистика критерия должна попасть в область принятия гипотезы, если верна гипотеза H0;
г) Вероятность, с которой статистика критерия должна попасть
в область принятия гипотезы, если верна гипотеза H1.
3. Когда при проверке гипотезы H0 : m = m0 против H1 : m = m1 следует выбрать правостороннюю критическую область:
а) H1 : m1 < m0;
б) H1 : m1 > m0;
в) H1 : m1 ¹m0;
г) H1 : m1 = m0.
4. Пусть статистика критерия
имеет нормальное
распределение. Какое условие является исходным для расчета значения
границы правосторонней
критической области:
а)
;
б)
;
в)
;
г)
.
5. Какая статистика используется при проверке
гипотезы
:
а)
;
б)
;
в)
;
г)
.
6. Для проверки какой гипотезы используется
статистика
:
а)
;
б)
;
в)
;
г)
.
7. Чему равна граница критической области при проверке на уровне значимости a = 0,0344, гипотезы H0 : m = 50, если H1: m = 52, s =3:
а) 2,15;
б) 1,97;
в) 1,82;
г) 2,88.
8. Чему равна граница критической области при проверке на уровне значимости a= 0,05, гипотезы H0 : m = 50, если H1: m1 = 52, S = 3, n =9:
а) 1,78;
б) 1,86;
в) 2,15;
г) 2,88.
9. Для проверки какой гипотезы применяется критерий Кохрана:
а)
;
б)
;
в)
;
г)
.
10. Какому закону распределения должна подчиняться
статистика
, при справедливости гипотезы H0:
а) Нормальному;
б) Фишера-Снедекора;
в) Стьюдента;
г) Пирсона.
Назад
к разделу "3.7. Гипотезы о виде законов распределения генеральной
совокупности"