8.
Проверка статистических гипотез

Цели обучения

В отличие от задачи, рассмотренной в предыдущей главе, мы имеем гипотезу, которую хотим апробировать на экспериментальных данных. Примеры некоторых гипотез:

Изучив материал данной темы, Вы:

8.1.
Основные понятия теории проверки гипотез

Удобнее обсуждать понятия на конкретном примере.

Пример

Менеджер ресторана недавно начал экспериментировать с новым способом приготовления пиццы. С его точки зрения, пицца, приготовленная новым способом, вкуснее, но для принятия окончательного решения о переходе на новый способ он хочет провести анализ мнения посетителей и планирует следующий эксперимент. Для 100 клиентов, заказавших пиццу на дом, он отправляет ее в двух вариантах приготовления и просит оценить в баллах свое мнение. Баллы от -10 до 10. Если клиент имеет сильное предпочтение к старому способу, то -10, к новому10, если все равно, то ноль и т.д. После сбора результатов какова должна быть процедура обработки?

Менеджер совсем не обязательно должен в данном случае использовать аппарат проверки гипотез. Но мы покажем, как он мог бы его использовать.

Нулевая и альтернативная гипотезы

Как правило, гипотезу, которую пытаются доказать, называют альтернативной, а которую опровергнуть — нулевой. Если обозначить в нашем примере среднее значение баллов как μ, то гипотезы могут быть записаны как:

(нулевая гипотеза), (альтернативная).

Односторонние и двусторонние тесты

Форма альтернативной гипотезы может быть односторонней или двусторонней, в зависимости, что хотят доказать. Если гипотеза может быть отвергнута результатами, как положительными, так и отрицательными, значит, мы имеем двусторонний случай, иначе односторонний.

Типы ошибок

В статистической теории проверки гипотез рассматривают ошибки двух типов.

Ошибка первого рода — отвергается истинная гипотеза.

Ошибка второго рода — не отвергается ложная гипотеза.

Уровень значимости и область отвержения гипотезы

Вероятность ошибки первого рода обычно обозначается α, называется уровнем значимости и принимает типичные значения 0,01 и 0,05. Задаваясь значением уровня значимости можно построить области, где гипотеза отвергается и не отвергается. Чем больше уровень значимости, тем больше вероятность ошибки первого рода и меньше вероятность ошибки второго рода и наоборот. Именно по этой причине выбор уровня значимости не является однозначным, а диктуется ситуацией и отношениям к ошибкам лица, принимающего решения (ЛПР).

8.2.
Проверка гипотез для математического ожидания

Вычисляем t-статистику.

Пример

Продолжим наш пример с менеджером ресторана (см. файл ПИЦЦА1.XLS (шаблон и решение). Есть ли основание отвергать гипотезу (склонность к старому способу приготовления)?

Решение

Напомним, что:

(нулевая гипотеза), (альтернативная)

В нашем случае μ0 = 0. Вычисляем t-статистику: t = 2,816 (табл. 29).

Таблица 29.
Проверка гипотезы о предпочтении новому виду пиццы

Клиент

Рейтинг

 

 

1

-7

Рейтинг

2

7

 

 

3

-2

Среднее

2,1

4

4

Стандартная ошибка

0,745757

5

7

Медиана

2

6

6

Мода

2

7

0

Стандартное отклонение

4,716583

8

2

Дисперсия выборки

22,24615

9

8

Эксцесс

-0,84047

10

2

Асимметричность

-0,21719

11

3

Интервал

17

12

-4

Минимум

-7

13

8

Максимум

10

14

-5

Сумма

84

15

7

Счет

40

16

-5

 

 

Использование функции СТЬЮДРАСП(2,816;39;1) показывает, что для нулевой гипотезы вероятность результата составляет всего 0,4%. А следовательно, даже при уровне значимости 1% гипотеза должна быть отвергнута, то есть новый вид пиццы предпочтительнее.

Данная задача может быть решена и средствами StatPro, а именно c помощью StatPro/Statistical Inference/One-Sample Analysis. Соответствующее табло представлено на рис. 105, а результаты на рис. 106.

Результат проверки, как и следовало ожидать, получается эдентичный.

8.3.
Проверка гипотез для остальных параметров

Проверка гипотез для различных параметров в своей основе аналогична тому, как исследовался вопрос о доверительных интервалах для различных параметров, так как используются те же распределения.

Проверка гипотез для доли совокупности

Выборочная доля имеет распределение, близкое к нормальному, поэтому вычисляем z-статистику по формуле:

Проверка гипотез для разности математических ожиданий

Вычисляется t-статистика по формулам:

Проверка гипотез для разности между долями совокупности

Пусть  — значения долей, а  — их разностные оценки. Стандартное отклонение вычисляется по формуле:

где  — выборочная пропорция, полученная по объединению выборок.

.

Далее используем функцию НОРМСТРАСП.

Литература

  1. Wisniewski M. Quantitative Methods for Decision Makers / Mik Wisniewski. — Prentice Hall, 2002. — 575 с.

  2. Айвазян С.А. Прикладная статистика и основы эконометрики: учебник / С.А. Айвазян, В.С. Мхитарян. — М.: ЮНИТИ, 1998. — 1022 с.

  3. Карлберг К. Бизнес-анализ с помощью Excel: пер. с англ. / К. Карлберг. — Киев: Диалектика, 1997. — 448 с.

  4. Макарова Н.В. Статистика в Excel / Н.В. Макарова, В.Я. Трофимец. — М.: Финансы и статистика, 2002. — 368 с.

  5. Орлова И.В. Экономико-математические методы и модели. Выполнение расчетов в среде Excel: практикум / И.В. Орлова. — М.: Финстатинформ, 2000. — 136 с.

  6. Томас Р. Количественные методы анализа хозяйственной деятельности: пер. с англ. / Ричард Томас. — М.: Дело и сервис, 1999. — 432 с.