Данный ноутбук является домашкой по курсу «R для теории вероятностей и математической статистики» (РАНХиГС, 2017-2018). Автор ноутбука вот этот парень по имени Филипп. Если у вас для него есть деньги, слава или женщины, он от этого всего не откажется. Ноутбук распространяется на условиях лицензии Creative Commons Attribution-Share Alike 4.0. При использовании обязательно упоминание автора курса и аффилиации. При наличии технической возможности необходимо также указать активную гиперссылку на страницу курса. На ней можно найти другие материалы. Фрагменты кода, включенные в этот notebook, публикуются как общественное достояние.
Приветствую вас внутри третьей домашки. По-прежнему, моими героями являетесь вы. Люблю вас. Всем лафки-плюшки. Краткий брифинг:
Ближе к делу. С чего начинается любой скрипт? Правильно! С подгрузки пакетов :)
library("ggplot2") # Пакет для красивых графиков
library("grid") # Пакет для субплотов
# Отрегулируем размер картинок, которые будут выдаваться в нашей тетрадке
library('repr')
options(repr.plot.width=4, repr.plot.height=3)
У распределения Хи-квадрат есть милое свойство. Известно, что если $X_1, \ldots, X_n \sim iid~N(0,1)$, тогда имеет место следующая сходимость по веротяности:
$$ \frac{\chi^2_n}{n} = \frac{X_1^2 + \ldots + X_n^2}{n} \to 1 $$Продемонстрируйте с помощью симуляций в R, что это именно так. От вас требуется построить ту же картинку, что мы строили при иллюстрации ЗБЧ.
# ваш код :3
Хорошо! Теперь зафиксируйте несколько коридоров также как мы делали это на паре и пронаблюдайте как ведут себя вероятности пробить эти коридоры при увеличении $n$.
# ваш код :3
Учитывая, что последовательность случайных величин, приведённая выше, сходится к константе, то есть к вырожденному распределению, дисперсия этой последовательности должна сходиться к нулю. Продемонстрируйте, что это действительно так. Для этого нужно скопипастить код из второго пункта и немного отредактировать его.
# ваш код :3
Если вы хорошо разбирались в лекциях по математической статистике, у вас должна была возникнуть в голове аналогия с Достаточным условием Чебышёва. Оно говорит, что если оценка неизвестного параметра является несмешённой, $E(\hat \theta) = \theta$ и дисперсия этой оценки стремится к нулю, $Var(\hat \theta) \to 0$ при $n \to \infty$, то эта оценка состоятельна.
Попробуйте ещё раз посмотреть на картинку, которую вы получили выше и переосмыслить это условие.
Хард продолжается. Пусть у нас есть последовательность из случайных величин $Y_n = \min(X_1, \dots X_n)$, где $X_i \sim U[0; 1]$. Попробуйте выяснить с помощью симуляций к чему будет сходиться последовательность $Y_n$. Как именно она будет туда сходиться? Когда выясните, попробуйте это доказать.
# ваш код :3
# и ваши картиночки :3
На паре мы с вами говорили про тяжёлые хвосты, диаграммы квантиль-квантиль и прочие страшные вещи. Давайте поговорим ещё о паре страшных штук, о коэффициенте асиметрии и эксцессе. С помощью этих штук можно быстро попытаться понять насколько хвосты распределения тяжелее нормальных.
Определение: начальным моментом порядка $k$ случайной величины $X$ называется математическое ожидание от $k$-ой степени этой случайной величины, $\alpha_k = E(X^k)$.
Определение: центральным моментом порядка $k$ случайной величины $X$ называется $\mu_k = E(X - (E(X))^k)$.
Определение: коэффициент асимметрии случайной величины это $\frac{\mu_3}{\sigma^3}$.
Определение: эксцесс случайной величины это $\frac{\mu_4}{\sigma^4} - 3$.
Определенеи: куртосис случайной велчины это эксцесс плюс три. Иногда эта фигня всплывает, поэтому решил тут дать ей определение.
Нормальное распределение имеет нулевой эксцесс. Если хвосты распределения "легче", то эксцесс больше нуля. Если тяжелее, то меньше нуля.
Норальное распределение симметрично, поэтому для него коэффициент асимметрии равен нулю. Если левый хвост распределения тяжелее, то коэффициент больше нуля. Если правый хвост распределения тяжелее, nо коэффициент меньше нуля.
Сгенерируйте выборку из стандартного нормального распределения, выборку из распределения хи-квадрат с 5 степенями свободы и выборку из распределения стьюдента с 3 степенями свободы. Вычислите выборочные эксцесс и коэффициент асимметрии для всех трёх распределений и проинтерпретируйте их.
# ваш код
В табличке лежат цены на криптовалюты. Скачайте цены на биткойн в долларах за последние два-три года. Подгрузите эти данные в R, перейдите к доходностям и помотрите насколько тяжелы хвосты распределения доходностей с помощью выборочныъ эксцесса и коэффициента асимметрии. Постройте для этих доходностей и нормального распределения диаграмму квантиль-квантиль.
# ваш код
Больше дичи про коэффициент асимметрии и эксцесс ищи по ссылкам. Там даже несмещённые оценки есть.
Миша понял, что продажа газет и страхование это не его и решил стать криптотрейдером. Миша хотел бы торговать биткойном. К сожалению, он не знает насколько это рискованно. Аналитик по доброй душе решает помочь Мише, несмотря на то, что он должен ему кучу денег со своих прошлых проектов.
В табличке лежит динамика стоимости биткойна. Скачайте данные и за последние два-три года постройте любым из рассмотренных на паре методов оценку для пятипроцентного $VaR$. Найдите $ES$. Проинтерпретируйте эти два показателя. Что всё это значит для Миши? Вылезет ли Миша когда-нибудь из долгов?
# Ваш код
Я подумал, что у вас было довольно мало практики по работе со сходимостями. Те, кто действительно хотел бы с ними разобраться, решат, что хочется порешать задачки. Тут приведена небольшая подборочка довольно простых задачек на сходимости. Никаких симуляций тут делать не надо. Просто возьмите бумажку, ручку и решить задачу. Мне свои решения скидывать не надо. На следующей неделе выложу решения, можно будет проверить себя. Часть задачек отсюда, часть отсюда.
К каким распределениям сходятся указанные ниже последовательности:
а) $Exp(n)$
б) $Exp(\frac{1}{n})$
в) $Bern(\frac{1}{n})$
г) $Geom(\frac{\lambda}{n}$)
д) $N(0, \frac{5 + n}{n^2})$
е) $N(\frac{n-1}{n+1}, 9)$
ж) $t(n)$
з) $X_n = \frac{\chi^2_n}{n+5}$
и) $X_n = \frac{\chi^2_n - n}{\sqrt{n}}$
к) $X_n = 2011 \cdot F_{2011,n}$.
# ваши решения, если не лениво и интересно!