Надежность и доверительный интервал
До сих пор мы рассматривали точечные оценки, т.е. такие оценки, которые определяются одним числом. При выборке малого объема точечная оценка может значительно отличаться от оцениваемого параметра, что приводит к грубым ошибкам. В связи с этим при небольшом объеме выборки пользуются интервальными оценками.
Интервальной называют оценку, определяющуюся двумя числами – концами интервала. Пусть найденная по данным выборки статистическая характеристика служит оценкой неизвестного параметра
. Очевидно,
тем точнее определяет параметр
, чем меньше абсолютная величина разности
. Другими словами, если
и
, то чем меньше d, тем точнее оценка. Таким образом, положительное число d характеризует точность оценки.
Статистические методы не позволяют утверждать, что оценка удовлетворяет неравенству
, можно говорить лишь о вероятности, с которой это неравенство осуществляется.
Надежностью (доверительной вероятностью) оценки по
называют вероятность g, с которой осуществляется неравенство
. Обычно надежность оценки задается заранее, причем, в качестве g берут число, близкое к единице – как правило, 0,95; 0,99 или 0,999.
Пусть вероятность того, что равна g:
.
Заменим неравенство равносильным ему двойным неравенством
.
Это соотношение следует понимать так: вероятность того, что интервал заключает в себе (покрывает) неизвестный параметр Q, равна
.
Таким образом, доверительным называют интервал , который покрывает неизвестный параметр с заданной надежностью
.
Определение доверительных интервалов
Доверительный интервал для математического ожидания нормального распределения при известной дисперсии
Пусть количественный признак X генеральной совокупности распределен нормально, причем среднее квадратическое отклонение s этого распределения известно. Требуется оценить неизвестное математическое ожидание a по выборочному среднему . Найдем доверительные интервалы, покрывающие параметр a с надежностью
.
Будем рассматривать выборочное среднее , как случайную величину
(т.к.
меняется от выборки к выборке), и выборочные значения
, как одинаково распределенные независимые случайные величины
(эти числа также меняются от выборки к выборке). Другими словами, математическое ожидание каждой из этих величин равно a и среднее квадратическое отклонение – s. Так как случайная величина X распределена нормально, то и выборочное среднее
также распределено нормально. Параметры распределения
равны:
.
Потребуем, чтобы выполнялось соотношение , где
– заданная надежность.
Используем формулу .
Заменим X на и s на
и получим:
,
где .
Выразив из последнего равенства , получим:
.
Так как вероятность P задана и равна , окончательно имеем:
.
Смысл полученного соотношения – с надежностью можно утверждать, что доверительный интервал
покрывает неизвестный параметр a, причем точность оценки равна
.
Таким образом, задача решена. Число определяется из равенства
; по таблице функции Лапласа находят аргумент
, которому соответствует значение функции Лапласа, равное
.
Следует отметить два момента: 1) при возрастании объема выборки n число убывает и, следовательно, точность оценки увеличивается, 2) увеличение надежности оценки
приводит к увеличению
(так как функция Лапласа – возрастающая функция) и, следовательно, к возрастанию
, то есть увеличение надежности оценки влечет за собой уменьшение ее точности.
Если требуется оценить математическое ожидание с наперед заданной точностью и надежностью
, то минимальный объем выборки, который обеспечит эту точность, находят по формуле
, следующей из равенства
.
Ищите квартиру в Кургане? Все самые удобные по лучшим ценам! Найдите то, что Вам по душе!