Повна версія

Головна arrow Природознавство arrow БІЗНЕС-СТАТИСТИКА

  • Увеличить шрифт
  • Уменьшить шрифт


<<   ЗМІСТ   >>

ВИБІРКА. ПЕРЕВІРКА ГІПОТЕЗ

В результаті вивчення глави 4 студент повинен:

знати

  • • методи формування вибірки, види вибірки;
  • • основні завдання, які вирішуються при застосуванні вибіркового методу;
  • • правила перевірки основних статистичних гіпотез;

вміти

  • • проектувати вибірку, що забезпечує необхідну точність результатів;
  • • розраховувати обсяг вибірки; формувати вибірку;
  • • розраховувати довірчі інтервали для генеральної середньої та відносної величини;
  • • оцінювати статистичну значущість відмінності між двома вибірками;
  • • проводити односторонню і двосторонню перевірку основних статистичних гіпотез;

володіти

  • • методами прикладної статистики для проектування репрезентативної вибірки і оцінки генеральних параметрів із заданою довірчою ймовірністю;
  • • методами перевірки статистичних гіпотез.

Застосування вибіркового методу

Вибірка з давніх часів є інструментом бізнесу. Купець, перш ніж прийняти рішення про закупівлю партії зерна, брав пробу з навмання взятого мішка і за її якістю робив висновок про всю партії зерна. Те ж можна сказати про перевірку будь-якого насипного або наливної товару. Вибіркова перевірка проводилася і під час закупівлі деревини, вовни, бавовни та ін. В сучасному бізнесі вибірки (вибіркові обстеження) проводяться, щоб виявити переваги споживачів і оперативно врахувати їх в бізнесі. На основі вибірки робиться висновок про якість продукції (див. Гл. 6). Вибірка фінансових документів застосовується в аудиті з метою виявлення помилок, на основі чого робиться висновок щодо частки фінансових документів, що містять помилку. Всі ці та подібні роботи служать прийняттю рішень в бізнесі.

Вибірка виробляється з сукупності, яка визначається як генеральна. Характеристики генеральної сукупності називаються параметрами ; характеристики вибірки називаються статистиками. Прийнято статистики позначати латинськими літерами, а параметри - грецькими (табл. 4.1).

Таблиця 4.1

прийняті позначення

показник

Генеральна сукупність

вибірка

обсяг сукупності

N

п

Середня

Д

X

частка

СО

W

дисперсія

а 2

S 2

коефіцієнт кореляції

р

г

Мета вибірки: на основі вибіркових характеристик оцінити генеральні параметри:

Інформація, отримана за вибіркою -> Висновок про генеральних параметрах,

N

Ставлення - - крок відбору. Наприклад, з 600 одиниць потрібно ото п

брати 60. Тоді крок відбору 600: 60 = 10, тобто до вибірки потрапляє кожна 10-я одиниця.

Рекомендується починати відбір з півкроку, тобто першій відібрати в вибірку п'яту одиницю, потім 15-ю і т.д.

Ставлення - - частка вибірки в генеральній сукупності.

Багато вибіркові процедури припускають рівну ймовірність попадання у вибірку, але можлива і нерівна ймовірність відбору. Наприклад, автомобілі Porsche повинні мати більший шанс бути включеними у вибірку, ніж Ford. В цьому випадку оцінка генеральної середньої повинна бути обчислена за вибіркою як зважена середня з великою вагою для Ford.

Для оцінки генеральних параметрів будується довірчий інтервал (до прийнятої довірчою ймовірністю):

• для генеральної середньої

• для генеральної частки

Обидва інтервалу засновані на вибірковій характеристиці і помилку вибірки.

Для великих вибірок (л> 30):

де z - коефіцієнт, що відповідає прийнятій довірчої ймовірності Ф (г); визначається по таблиці інтеграла ймовірностей; Л * - гранична помилка вибіркової середньої; A vv - гранична помилка вибіркової частки.

Для малих вибірок (п <30):

де t - коефіцієнт, що відповідає прийнятій довірчої ймовірності Ф (0; визначається по таблиці розподілу Стьюдента для (п - 1) ступенів свободи.

Середня квадратична помилка вибіркової середньої, ст *, визначається як

де - генеральна дисперсія змінної х.

Середня квадратична помилка вибіркової частки, ct w , визначається за формулою (4.6):

Як правило, величина генеральної дисперсії невідома. Тоді використовують вибіркову оцінку дисперсії sj.

Якщо s * невідома, то приймають ймовірну оцінку, використовуючи

1

співвідношення для нормального розподілу: s «- • розмах варіації.

6

Якщо розподіл свідомо скошене, то • розмах. Якщо є відомості про середнє значення, то середньоквадратичне відхилення можна прийняти 5 * ^ х. Якщо невідома дисперсія відносної величини, то приймається її максимальне значення, = w (l-iv) = 0,25. При малому числі спостережень, п < 30, формула (4.5) має вигляд

У наведених формулах не враховувався обсяг генеральної сукупності. На практиці застосовується коригування на кінцівку генеральної сукупності (fpc - finite population correction ):

129

де N - чисельність генеральної сукупності; п - чисельність вибірки.

У табл. 4.2 представлені приклади коригування на кінцівку генеральної сукупності.

Таблиця 4.2

Коригування на кінцівку генеральної сукупності

Дисперсія вибіркової середньої за умови нескінченності генеральної сукупності

Дисперсія вибором-ної середньої за умови кінцівки генеральної сукупності

приклади fpc

п = 20 N = 50

  • 25
  • 100
  • 50
  • 1000
  • 100
  • 10000

sL

п

fH)

0,6

0,75

0,95

0,99

Коригування на кінцівку генеральної сукупності забезпечує отримання більш вузького довірчого інтервалу, тобто дає меншу невизначеність в оцінці генерального параметра. У тому випадку, коли вибірка становить малу частку генеральної сукупності (5% або менше), коригуванням на кінцівку генеральної сукупності можна знехтувати.

Розрахунок чисельності вибірки для забезпечення результатів заданої точності. Якщо приймається рішення про проведення вибіркового спостереження, то, по-перше, визначається обсяг вибірки (sample size). Оскільки гранична помилка вибірки

звідси

де п - обсяг вибірки; z - значення, відповідне прийнятої довірчої ймовірності (визначається по таблиці нормального розподілу); а 2 - генеральна дисперсія (або її оцінка); Д 2 - квадрат допустимої помилки вибірки

Чим нижче необхідної точності, тим менше чисельність вибірки. Як випливає з формули (4.9), помилка вибірки прямо пропорційна дисперсії. Тому чим менше дисперсія досліджуваної ознаки х, тим менше буде величина помилки, тобто однорідність даних сприяє зменшенню помилки вибірки.

Для забезпечення однорідності нерідко доводиться розділяти генеральну сукупність на однорідні частини (страти). Такий поділ називається стратифікацією. Формування вибірки проводиться шляхом відбору з страт. Обсяг вибірки п деяким способом розподіляється по стратам. Можна розподілити загальний обсяг вибірки пропорційно чисельності одиниць в кожній страті:

де п - обсяг вибірки (число одиниць у вибірці); п ; - обсяг вибірки, який припадає на j-ю страту; Nj - кількість одиниць в j-й страті в генеральної сукупності; N - число одиниць у генеральній сукупності.

Інший спосіб розподілу обсягу вибірки по стратам заснований на обліку не тільки числа одиниць, а й однорідності страт (вимірюваноївеличиною дисперсії). Чим більш однорідна страта, тим менше одиниць обсягу вибірки доведеться на неї:

де - генеральна дисперсія в j-ой стратегії.

При стратифікованою вибіркою оцінка генеральної середньої буде дорівнює

де х - вибіркова середня; до - число страт.

Проектуючи вибірку, потрібно мати на увазі, що обсяг вибірки можна розраховувати виходячи з характеристик і необхідної точності для різних змінних: наприклад, вироблення на годину або день, частки робітників з дітьми дошкільного і шкільного віку, заробітної плати і т.д. Нехай при розрахунку обсягу вибірки з вироблення виявилося достатнім обстежити 100 робочих, а для забезпечення точності в оцінці частки робітників з дітьми дошкільного і шкільного віку потрібно обстежити 200 чоловік - необхідний обсяг вибірки збільшився в два рази. Якщо обсяг вибірки збільшився в п'ять разів і більше, потрібно запропонувати коротку програму обстеження для максимальної вибірки (п тах ), а з цієї чисельності виділити одиниці, які відповідають більш рідкісним характеристикам (скажімо, наявність неповнолітніх дітей). Така конструкція вибірки відповідає багатофазовий відбору.

Після проведення вибіркового обстеження потрібно оцінити репрезентативність вибірки. Це робиться за допомогою розрахунку граничної помилки вибірки Д х , Aiv і порівняння цих величин з допустимою величиною похибки, яка закладалася в розрахунок обсягу вибірки. Якщо гранична помилка вибірки дорівнює допустимої похибки або менше неї, то вибірка вважається репрезентативною. В іншому випадку доводиться проводити розрахунок ймовірності, з якою можна прийняти результати вибірки, шляхом ділення граничної помилки вибірки на середню похибку вибірки:

Будівельна фірма спільно з проектувальниками житлових квартир вирішила провести вибіркове обстеження для встановлення середнього розміру домогосподарств і виявлення бажаного розміру і планування квартир. У населеному пункті, де планується будівництво, проживає 4000 домогосподарств. Вирішено, що гранична помилка вибірки при визначенні середнього розміру домогосподарства не повинна перевищувати 0,5 чол. з ймовірністю 0,95 при середньому квадратичному відхиленні 1,1 чол.

Визначимо обсяг вибірки:

Округлимо обсяг вибірки до 20 домогосподарств. Частка вибірки в генераль-

4000

ної сукупності складе (20: 4000) • 100% = 0,5%. Крок відбору =

= 200-е домогосподарство. Маючи списки домогосподарств, починають відбір з півкроку, тобто з 100-го домогосподарства, яке першим відбирається для обстеження. Наступним буде 300-е, потім - 500-е і т.д., поки не відберемо 20 домогосподарств. Вибірка мала, тому розподіл вибіркових характеристик підпорядковується розподілу Стьюдента.

Довірчий інтервал для генеральної середньої:

Серед опитаних 100 співробітників фірми (загальне число працівників - 400 чол.) Виявилося, що частка співробітників, які орендують житло, становить 20% (20 чол.). Довірчий інтервал для частки співробітників, які орендують житло, має вигляд

де Д, "- гранична помилка вибірки для частки,

Звідси частка співробітників фірми, які орендують житло, становить не менше 14% і не більше 26% (з ймовірністю 0,95).

М'ясопереробний комбінат щодня випускає 800 батонів ковбаси «Докторська» масою 1200 г для подальшої реалізації в мережі супермаркетів «Стрічка». Відділ контролю якості комбінату здійснює перевірку готової продукції за кількома параметрами, в тому числі по вазі батона. Відповідно до вимог служби закупівель мережі «Стрічка» відхилення ваги одного батона ковбаси більше ніж на ± 20 г від заявленого в договорі поставок вважається неприпустимим. За даними контрольного зважування п'яти батонів ковбаси, середня вага одного батона склав 1200 г при середньому квадратичному відхиленні 18 м З якою ймовірністю можна стверджувати, що вага батонів ковбаси в партії буде не менше 1180 г і не більше 1220 г?

Оскільки гранична помилка вибірки дорівнює Д * = t х ст х , звідси

Згідно з умовою, Д х = ± 20 м

Середня помилка вибірки складе

Розрахованим значенням t відповідає ймовірність 0,963 (по таблиці розподілу Стьюдента при чотирьох ступенях свободи).

 
<<   ЗМІСТ   >>