Точечные оценки параметров распределений
Точечная оценка математического ожидания
Пусть выборка из генеральной совокупности, соответствующей случайной величине x с неизвестным математическим ожиданием Mx =q и известной дисперсией
.
Рассмотрим оценку неизвестного математического ожидания
.
Оценка несмещённая, поскольку её математическое ожидание равно Mx =q :
,
Оценка состоятельная, поскольку при n®¥, :
.
Итак, для оценки неизвестного математического ожидания случайной величины будем использовать выборочное среднее: .
Точечная оценка дисперсии
Для дисперсии случайной величины
можно предложить следующую оценку:
, где
— выборочное среднее.
Доказано, что эта оценка состоятельная, но смещенная.
В качестве состоятельной несмещенной оценки дисперсии используют величину
.
Именно несмещенностью оценки объясняется ее более частое использование в качестве оценки дисперсии.
Пример 1
Пример 1. Задана выборка, содержащая 100 значений случайной величины.
Вычислим точечные оценки математического ожидания и дисперсии случайной величины.
На приведенном ниже рисунке изображён фрагмент листа Excel с вычислениями.
Получили .
Точечная оценка вероятности события
Предположим, что в некотором эксперименте событие A происходит (благоприятный исход испытания) с вероятностью p и не происходит с вероятностью q =1– p и пусть случайная величина m — количество благоприятных исходов в серии испытаний. Задача состоит в получении по результатам серии n случайных экспериментов оценки неизвестного параметра распределения p.
При заданном числе испытаний n величина m — случайная величина, имеющая биномиальное распределение. Если событие A в серии из n независимых испытаний произошло m раз, то m— значение случайной величиныm.
Оценку величины
будем вычислять по формуле
.
Эта оценка несмещённая, состоятельная и эффективная.
Доказано, что эта оценка эффективна — обладает при прочих равных условиях минимальной дисперсией.
На рисунке приведен график зависимости точечной оценки вероятности pчисла успехов от числа испытаний n в серии испытаний Бернулли. График построен по выборке 1000 значений случайной величины, имеющей биномиальное распределение с параметром p = 0.4. Видно, что с ростом числа испытаний точечная оценка приближается к известному точному значению параметра, которое равно 0.4.
График зависимости точечной оценки вероятности от числа испытаний
Пример 2
Пример 2. Задана выборка, содержащая 20 значений случайной величины (значения m) — количество успехов в эксперименте из 1000 независимых испытаний (проведено 20 одинаковых экспериментов по 1000 независимых испытаний в каждом).
Найдём точечную оценку вероятности успеха p и исследуем статистические свойства этой оценки.
На приведенном ниже рисунке изображён фрагмент листа Excel с вычислениями.
Вычисленные значения оценки вероятности записаны в столбце B. Видно, что все эти значения близки к 0.3.
Получили: значения оценки попадают в интервал [0.272, 0.325] длины 0.053, . Можно достаточно уверенно полагать вероятность успеха равной 0.3.
Точечная оценка параметров равномерного распределения
Пусть выборка из генеральной совокупности, соответствующей случайной величине x, имеющей равномерное распределение на [0, q] с неизвестным параметром q. Наша задача — оценить этот неизвестный параметр.
Для случайной величины x , имеющей равномерное распределение на [0, q] математическое ожидание и дисперсия известны: и
.
А поскольку оценка величины Mx известна, , то за оценку параметра q можно взять оценку
.
Несмещенность оценки очевидна: .
Состоятельность:
,
т.е. при n®¥дисперсия оценки стремится к нулю.
Для получения другой оценки параметра обратимся к другой статистике:
Пусть .
Найдем функцию распределения случайной величины :
, для
.
Тогда математическое ожидание и дисперсия случайной величины равны соответственно
и
, т.е. оценка
состоятельная, но смещенная.
Однако если вместо рассмотреть
, то
и
,
— состоятельная и несмещенная оценка.
А поскольку , то оценка
существенно эффективнее оценки
. Например, при
разброс оценки
в 33 раза меньше разброса оценки
.
Последний пример еще раз показывает, что выбор статистической оценки неизвестного параметра распределения — важная и нетривиальная задача.
Пример 3
Пример 3. Задана выборка, содержащая 100 значений случайной величины, о которой известно, что она имеет равномерное распределение на промежутке [0, q].
Вычислим и сравним три оценки неизвестного параметра q, котрые вычисляются по формулам:
,
,
.
На приведенном ниже рисунке изображён фрагмент листа Excel с вычислениями.
Как и следовало ожидать, оценка, полученная по формуле , совпадает с первой точечной оценкой.