Telegram: @ninachely


Воспоминания о прошлом

Наша основная мечта — превратить точечные оценки в доверительные интервалы, чтобы проверять гипотезы. Продолжаем обсуждать бутстрэп

В предыдущей лекции обсудили наивный бутстрэп:

FBDD4B41-6D26-4517-A232-0CA62D55BE15_1_201_a.jpeg

$$ P(\theta \in CI_{boot}^{naive}) - P_{nom} = O\left(\frac{1}{\sqrt{n}}\right) $$

Если увеличим $n$ в 100 раз, что $|\Delta P|$ — разница между номинальной и фактической вероятностью покрытия — упадет в 10 раз

Также обсудили бутстрэп t-статистики:

Screenshot 2022-12-05 at 17.24.26.png

$$ q_L(t^{}) \leqslant \frac{\hat{\theta} - \theta}{se(\hat{\theta})} \leqslant q_R(t^{}) $$

Решаем неравенство относительно $\theta$

$$ \Rightarrow \theta \in [\hat{\theta} -q_R(t^{}) \cdot se(\theta^{}) ; \hat{\theta} - q_L(t^{*}) \cdot se(\hat{\theta}) ] $$

Выигрыш состоит в том, что

$$ |P(\theta \in CI_{t-\text{стат}}^{boot}) - P_{nom}| = O\left(\frac{1}{n}\right) $$

<aside> 💡 Асимптотика не очень сильно зависит от $n_{boot}$ (его можно увеличивать “очень дешево”)

</aside>

Недостаток состоит в том, что нужна формула для стандартной ошибки $se(\hat{\theta})$ (для оценки корня из дисперсии)

А что делать, если мы не знаем эту формулу? Можем заплатить падением скорости расчетов, но обеспечить нужную точность без знания стандартной ошибки

Бутстрэп в бутстрэпе