Калькулятор размера выборки
Этот калькулятор поможет Вам самостоятельно рассчитать необходимый размер выборки для Вашего количественного исследования. Для этого просто введите размер изучаемой (генеральной) совокупности (например, все население г.Жмеринки, чел.), укажите необходимые Вам доверительную вероятность и доверительный интервал (значение в %, десятые доли - через точку). Затем нажмите на "Рассчитать" - и результат перед Вами.

Доверительный интервал


По сути доверительный интервал представляет собой заранее задаваемую Вами погрешность выборки. Например, если Вы задаете доверительный интервал в 3% и ответы на конкретный вопрос исследования составят 48%, это значит, что даже при проведении опроса всей генеральной совокупности, реальное значение попадет в интервал между 45% (48-3) и 51% (48+3).

Доверительная вероятность


Она показывает, насколько Вы можете быть уверены в полученных результатах, в том, что характеристики выборки соответствуют характеристикам всей изучаемой (генеральной) совокупности. Иными словами - с какой вероятностью случайный ответ попадет в доверительный интервал. Обычно применяют 95% и 99% доверительную вероятность. Чаще всего используется 95% - этого вполне достаточно в подавляющем большинстве исследований. Если объединить доверительную вероятность и доверительный интервал, то можно сказать, что ответы на вопрос с 95% вероятностью попадут в интервал между 45% и 51%.

Живой пример


Выборка рассчитана для 95% вероятности и 3% доверительного интервала. Допустим, для некоторой изучаемой совокупности (город с 1 млн. жителей) это составило 1066 интервью. Теперь, если мы провели 1066 интервью с потребителями и 60% ответили, что они предпочитают брэнд A, Вы можете быть уверены, что от 57% до 63% населения действительно предпочитает этот брэнд. На практике различия в размере выборки важны далеко не всегда. Так, размер выборки принципиально важен, если определяются доли рынка, и необходимо изучить ситуацию с конкурентами, занимающими долю, сравнимую с доверительным интервалом (скажем, 2%-5%) или когда изучается несколько групп продуктов и требуется анализ по каждой группе в отдельности. Иначе говоря, размер выборки важен, когда наименьшая изучаемая ячейка массива данных сравнима по размеру с доверительным интервалом. Также следует помнить, что в количественном исследовании такая наименьшая изучаемая ячейка массива данных не должна быть меньше 15-20 единиц в абсолютном выражении. В реальных исследованиях чаще всего важна не столько точность полученных значений, сколько возможность сравнения полученных значений между собой. И доверительный интервал подбирается, исходя именно из возможности сравнения значений, которые будут получены.

 

Определение размера выборки
Доверительная вероятность: 95% 99%
Доверительный интервал:
Генеральная совокупность:
Необходимый размер выборки:



Вы, наверное, заметите, что когда генеральная совокупность превышает некоторое значение, дальнейшее ее увеличение практически не влияет на размер выборки. Так, и для 1 млн. и для 10 млн. размер выборки будет одинаков. Это полезно помнить при проведении исследований в нескольких крупных городах - количество населения не играет роли, если анализ проводится по каждому городу в отдельности, а не в совокупности.

А всегда ли нужна репрезентативность выборки?


В принципе, задание репрезентативности (т.е. соответствия характеристик выборки характеристикам генеральной совокупности) необходимо только при административно заданном небольшом размере самой выборки - если нет денег, если нет ресурсов для полевых работ, если так решил директор и т.п. На практике же все основные задачи, даже измерение емкости рынка, можно решить при помощи грамотной случайной выборки, что будет более правильно.

Простая случайная выборка по мере увеличения ее размера все более приближается по характеристикам к репрезентативной. Стало быть, вопрос только в том, насколько большой должна быть случайная выборка, чтобы удовлетворять заданной погрешности. Однако, если технология случайного отбора в исследовательской компании хромает, задаются дополнительные квоты для обеспечения репрезентативности внутри целевой группы, иначе получится "перекос". Чем больше таких квот, тем, видимо, хуже технология. Впрочем, все шероховатости устраняются с помощью "перевзвешивания" массива данных с помощью того же SPSS.

Вам не все ясно? Остались вопросы?


Пишите в B&M - мы поможем.