Telegram: @ninachely
Наша основная мечта — превратить точечные оценки в доверительные интервалы, чтобы проверять гипотезы. Продолжаем обсуждать бутстрэп
В предыдущей лекции обсудили наивный бутстрэп:
$$ P(\theta \in CI_{boot}^{naive}) - P_{nom} = O\left(\frac{1}{\sqrt{n}}\right) $$
Если увеличим $n$ в 100 раз, что $|\Delta P|$ — разница между номинальной и фактической вероятностью покрытия — упадет в 10 раз
Также обсудили бутстрэп t-статистики:
$$ q_L(t^{}) \leqslant \frac{\hat{\theta} - \theta}{se(\hat{\theta})} \leqslant q_R(t^{}) $$
Решаем неравенство относительно $\theta$
$$ \Rightarrow \theta \in [\hat{\theta} -q_R(t^{}) \cdot se(\theta^{}) ; \hat{\theta} - q_L(t^{*}) \cdot se(\hat{\theta}) ] $$
Выигрыш состоит в том, что
$$ |P(\theta \in CI_{t-\text{стат}}^{boot}) - P_{nom}| = O\left(\frac{1}{n}\right) $$
<aside> 💡 Асимптотика не очень сильно зависит от $n_{boot}$ (его можно увеличивать “очень дешево”)
</aside>
Недостаток состоит в том, что нужна формула для стандартной ошибки $se(\hat{\theta})$ (для оценки корня из дисперсии)
А что делать, если мы не знаем эту формулу? Можем заплатить падением скорости расчетов, но обеспечить нужную точность без знания стандартной ошибки