3.7.2. Критерий Пирсона

 

Критерий Пирсона или критерий c2 (хи - квадрат) имеет наибольшее применение при проверке согласования теоретической и эмпирических кривых распределения. Наблюдаемое значение критерия  вычисляется по следующей формуле:

,                                                                                        (3.31)

где     - эмпирическая частота i-го интервала (варианта);

  - теоретическая частота i-го интервала (варианта);

    - число интервалов (вариантов).

         Как известно, c2 - распределение зависит от числа степеней свободы, это число находится по формуле:

                                      ,                                                                                      (3.32)

 

где    r - число неизвестных параметров предполагаемого теоретического закона, использованных для вычисления теоретических частот и оцениваемых по выборке.

По теоретическим соображениям при расчете  не следует исходить из слишком малых значений . Поэтому рекомендуется объединять соседние интервалы (варианты) таким образом, чтобы > (510) для объединенных интервалов. Кроме того, объем выборки должен быть достаточно велик (n ³ 50) и .

В случае нормального закона распределения расчет теоретической кривой распределения j(x) производится при условии, что статистические характеристики  приравниваем числовым характеристикам нормального закона (m; s), поэтому r = 2 и число степеней свободы         n = -3.

Вероятности попадания случайной величины X в соответствующие интервалы вычисляется по интегральной теореме Лапласа:

,                                             (3.33)

 

где    ;    .

В случае биномиального закона распределения расчет теоретической кривой распределения производится при условии, что статистическая доля (частость) приравнивается вероятности p появления интересующего нас события А, поэтому r = 1 и число степеней свободы            n = -2.

Вероятность pi  того, что случайная величина X принимает значение xi = m, где , определяется по формуле Бернулли:

,                                 (3.34)

где     - средняя частость проявления появления события во всех k выборках;

n - число испытаний в каждой выборке.

В случае закона Пуассона расчет теоретической кривой распределения производится при условии, что средняя интенсивность  приравнивается математическому ожиданию M(x), поэтому r = 1 и n = -2.

Вероятность pi  того, что случайная величина X принимает значение xi = m, определяется по формуле Пуассона:

,                                                           (3.35)

где     - средняя интенсивность.

mi - частота появления значения хi; i=1, 2, ... , к.

При проверке гипотез о виде законов распределения могут быть использованы и другие критерии согласия: Колмогорова, Романовского, Ястремского и др.

 

Пример 3.5. По данным таблицы рассчитать теоретические частоты в предположении нормального закона распределения; результаты вычислений приводятся в следующей таблице.

 

Интервалы

3,65-3,75

3,75-3,85

3,85-3,95

3,95-4,05

4,05-4,15

4,15-4,25

4,25-4,35

1

6

11

15

9

6

2

2

5

11

14

11

5

2

 

На уровне значимости 0,05 проверить гипотезу о нормальном законе распределения.

 

Решение. Вычисляем наблюдаемое значение критерия   по формуле (3.31). Результаты вычислений представим в виде таблицы.

 

Интервалы

3,65-3,75

 

3,75-3,85

 

0

 

0

3,85-3,95

11

11

0

0

3,95-4,05

15

14

1

4,05-4,15

9

11

4

4,15-4,25

 

4,25-4,35

1

å

50

50

-

= 0,578

 

По таблице c2 - распределения на уровне значимости 0,05 и числе степеней свободы n = -3 = 5 - 3 = 2 определим = 5,991. Так как    = 0,578 < = 5,991, нулевая гипотеза H0 не отвергается, т.е. производительность труда для данной совокупности подчиняется нормальному закону распределения.

 

Пример 3.6. Даны следующие числа рождения мальчиков у 50 матерей, родивших четыре раза:

 

3

1

0

2

1

2

1

3

3

3

2

3

2

2

1

2

1

3

2

3

3

0

1

1

2

2

1

0

3

2

0

2

2

2

3

3

2

4

3

3

2

1

1

2

2

3

3

2

3

4

 

Проверить на уровне 0,01 гипотезу о биноминальном законе распределения.

 

Решение. Всего 50 матерей родили N = k×n = 50×4 = 200 детей. Случайной величиной X является число мальчиков в семьях из 4 детей. Построим вариационный ряд:

 

xi

0

1

2

3

4

å

4

10

18

16

2

50

 

Эмпирическими частотами  являются числа матерей, родивших определенное число мальчиков.

Рассчитаем среднюю частоту рождения мальчика:

.

 

По формуле (3.34) вычислим вероятности комбинаций рождения мальчика (и девочки) в семьях из 4 детей:

 

m = 0; ;

m = 1; ;

m = 2; ;

m = 3; ;

m = 4; .

Итого: .

Теоретические частоты равны  = k×pi. Рассчитаем наблюдаемое значение критерия .

 

xi

0

 

1

1

2

18

19

1

3

 

4

1

å

50

50

-

= 0,370

 

По таблице c2 - распределения на уровне значимости a = 0,01 и при числе степеней свободы n = -2 = 3 - 2 = 1 определяем = 6,635.

        

Так как = 0,370 < = 6,635, нулевая гипотеза не отвергается, т.е. число мальчиков в семье из 4 детей данной совокупности подчиняется биноминальному закону распределения.

 

Пример 3.7. Число рабочих, не выполнивших сменного задания в 100 выборках по 20 рабочих, приводится в таблице:

 

Число рабочих xi

0

 

1

2

3

4

Число выборок mi

85

11

3

1

0

 

На уровне значимости 0,05 проверить гипотезу о законе Пуассона.

 

Решение. Определяем среднюю интенсивность числа рабочих, не выполнивших сменного задания, на одну выборку:

 

         По таблице  определяем .

 


По формуле (3.35) вычисляем вероятности:

 

;

;

;

.

 

Вычисляем наблюдаемое значение критерия:

 

xi

0

85

 

82

9

1

11

16

25

2

 

3

4

å

100

100

-

= 3,671

        

По таблице  c2 - распределения на уровне значимости 0,05 и при числе степеней свободы n = l-2 = 3 - 2 = 1 определяем = 12,706.

Так как (= 3,671) < (= 12,706), нулевая гипотеза H0  не отвергается, т.е. число рабочих, не выполнивших сменного задания, подчиняется закону Пуассона.


Таблица 3.1

 

Основные формулы, используемые при проверке гипотез  о значении параметров распределений

пп

H0

Условия

проверки

Используемое распределение

Формулы для вычисления наблюдаемого значения параметров

H1

Порядок определения критического значения критериев

Правила проверки

1

2

3

4

5

6

7

8

 

 

s2

Ф(t)

m1<m0; m1>m0

(1-2a)®tкр

отвергается

 

 

известна

 

 

 

m1¹m0

(1-a)®tкр

с вероятностью

ошибки a

1

m=m0

 

 

s2не

 

S(t)

m1<m0; m1>m0

 

 

 

известна

 

 

 

m1¹m0

 

 

 

 

 

 

Ф(t)

 

 

mx<my; mx>my

(1-2a)®tкр

не отвергается

 

 

 

 

2

mX=mY

известны

 

 

mx¹my

 

 

 

(1-a)®tкр

 

 

 

 

 

 

 

 не

известны,

но =

 

S(t)

mx<my; mx>my

 

 

 

 

 

mx¹my

 

 

 

 

 

 

 

 

не отвергается

 

3

 

 

 

 

c2

 

 

 

 

® H0 не отвергается

 

При

или

® H0 отвергается

 

 

 

 

 

не отвергается

4

F

не отвергается

 

 

 

 

5

 

 

 

 

n1 ¹ n2 ¹ ...

... ¹

ni > 4

c2

не отвергается

 

n1 = n2 = ...

... =

G

не отвергается

6

p1 = p2 =

... = p

n ®¥

c2

не отвергается


Тест

 

1. Что называют ошибкой первого рода:

         а) Гипотеза H0  верна и ее принимают согласно критерию;

         б) Гипотеза H0  верна и ее отвергают согласно критерию;

         в) Гипотеза H0  не верна и ее отвергают согласно критерию;

         г) Гипотеза H0  не верна и ее принимают согласно критерию.

 

2. Что называют мощностью критерия:

         а) Вероятность, с которой статистика критерия должна попасть в критическую область, если верна гипотеза H0;

         б) Вероятность, с которой статистика критерия должна попасть в критическую область, если верна гипотеза H1;

         в) Вероятность, с которой статистика критерия должна попасть в область принятия гипотезы, если верна гипотеза H0;

         г) Вероятность, с которой статистика критерия должна попасть             

в область принятия гипотезы, если верна гипотеза H1.

 

3. Когда при проверке гипотезы H0 : m  = m0 против H1 : m  = m1 следует выбрать правостороннюю критическую область:

         а) H1 : m1  < m0;

         б) H1 : m1  > m0;

         в) H1 : m1  ¹m0;

         г) H1 : m1  = m0.

 

4. Пусть статистика критерия  имеет нормальное распределение. Какое условие является исходным для расчета значения  границы правосторонней критической области:

         а)

         б) ;

         в) ;

г) .

5. Какая статистика используется при проверке гипотезы :

         а)

         б) ;

         в) ;

г) .


6. Для проверки какой гипотезы используется статистика :

         а) ;  

         б)

         в) ;

         г) .

7. Чему равна граница критической области при проверке на уровне значимости a = 0,0344, гипотезы H0 : m  = 50, если H1: m  = 52, s =3:

         а) 2,15;

         б) 1,97;

         в) 1,82;

         г) 2,88.

 

8. Чему равна граница критической области при проверке на уровне значимости  a= 0,05, гипотезы H0 : m  = 50, если H1: m1  = 52, S  = 3,    n =9:

         а) 1,78;

         б) 1,86;

         в) 2,15;

         г) 2,88.

 

9. Для проверки какой гипотезы применяется критерий Кохрана:

         а) ;

         б) ;

         в) ;

         г) .

 

10. Какому закону распределения должна подчиняться статистика , при справедливости гипотезы H0:

         а) Нормальному;

         б) Фишера-Снедекора;

         в) Стьюдента;

         г) Пирсона.

 


 

 

К оглавлению

Назад к разделу "3.7. Гипотезы о виде законов распределения генеральной
совокупности"

Вперед к разделу "4. КОРРЕЛЯЦИОННЫЙ АНАЛИЗ"