Вероватноћа и статистика/Теорија — разлика између измена
Пређи на навигацију
Пређи на претрагу
м (+Druga glava) |
м (→Варијанса: Kod osobina kovarijanse, promenljive X, Y i Z ne moraju biti nezavisne) |
||
(Није приказано 20 међуизмена 3 корисника) | |||
Ред 67: | Ред 67: | ||
* '''Тотална вероватноћа:''' <math>P(A) = P(H_1) P(A|H_1) + P(H_2) P(A|H_2) + ...</math> | * '''Тотална вероватноћа:''' <math>P(A) = P(H_1) P(A|H_1) + P(H_2) P(A|H_2) + ...</math> | ||
* '''Бајесова формула:''' За <math>A \subset \Omega</math>, <math>P(A) \neq 0</math> важи <math>P(H_i|A) = \frac{P(A|H_i) P(H_i)}{P(A)} = \frac{P(A|H_i) P(H_i)}{P(H_1) P(A|H_1) + P(A|H_2) A(H_2) + ... + P(A|H_n) P(H_n)}</math> | * '''Бајесова формула:''' За <math>A \subset \Omega</math>, <math>P(A) \neq 0</math> важи <math>P(H_i|A) = \frac{P(A|H_i) P(H_i)}{P(A)} = \frac{P(A|H_i) P(H_i)}{P(H_1) P(A|H_1) + P(A|H_2) A(H_2) + ... + P(A|H_n) P(H_n)}</math> | ||
* '''Поузданост уређаја:''' вероватноћа да је уређај исправан, која зависи од поузданости његових компоненти. Две компоненте могу међусобно бити повезане редно или паралелно, и у зависности од тога одређујемо укупну поузданост те две компоненте. | |||
** '''Редно:''' <math>P = P_1 \cdot P_2</math> | |||
** '''Паралелно:''' <math>P = 1 - (1 - P_1)(1 - P_2) = P_1 + P_2 - P_1 P_2</math> | |||
== Случајне променљиве == | |||
* '''Случајна променљива:''' пресликавање скупа свих исхода <math>\Omega</math> у скуп реалних бројева. | |||
** Ознака: <math>X \in \{x_1, x_2, ...\}</math> где је <math>\{x_1, x_2, ...\}</math> скуп свих бројева у које се пресликавају исходи. | |||
** На основу пребројивости скупа <math>\{x_1, x_2, ...\}</math> случајне променљиве се деле на две категорије: | |||
*** '''Дискретне:''' уколико је овај скуп коначан или пребројив, и | |||
*** '''Непрекидне (мешовите):''' уколико је овај скуп непребројив. | |||
* '''Расподела случајне променљиве:''' функција дефинисана над скуповима реалних бројева, <math>P_X(B) = P(X \in B), B \subset \mathbb{R}</math> | |||
** '''Закон расподеле вероватноће случајне променљиве:''' за неку случајну променљиву <math>X</math>, чији је скуп вредности <math>\{x_1, x_2, ...\}</math>, то је скуп вероватноћа <math>\{p_1, p_2, ...\}</math> где је <math>p_i = P(X = x_i)</math> за све <math>x_i</math> | |||
** Ознака: <math>X: \begin{pmatrix} | |||
x_1 & x_2 & ... \\ | |||
p_1 & p_2 & ... | |||
\end{pmatrix}</math>, тако да <math>\sum p_i = 1</math> | |||
=== Непрекидне случајне променљиве === | |||
* '''Функција расподеле:''' <math>F(x) = P(X \leq x)</math>, за <math>x \in \mathbb{R}</math> | |||
* Особине функције расподеле: | |||
*# <math>(\forall x \in \mathbb{R}) F(x) \in [0, 1]</math> | |||
*# <math>F(x)</math> је монотоно неопадајућа функција | |||
*# <math>F(x)</math> је непрекидна са десне стране за свако <math>x \in \mathbb{R}</math> | |||
*# <math>F(x)</math> има граничну вредност са леве стране у свакој тачки <math>x \in \mathbb{R}</math> | |||
*# <math>\lim_{x \to -\infty} F(x) = 0, \lim_{x \to +\infty} F(x) = 1</math> | |||
* '''Функција густине расподеле:''' ако је <math>f(x)</math> ненегативна функција дефинисана на <math>\mathbb{R}</math> и важи <math>(\forall x \in \mathbb{R}) F(x) = \int_{-\infty}^x f(t) dt</math>, онда је <math>X</math> непрекидна случајна променљива а <math>f(x)</math> њена функција густине расподеле. | |||
** <math>X</math> је непрекидна <math>\implies F(x)</math> је непрекидна | |||
** Ако <math>f(x)</math> има коначно или пребројиво много тачака прекида, у њима се <math>f(x)</math> може дефинисати произвољно. | |||
* '''Теорема 3.1:''' За непрекидну случајну променљиву <math>X</math> важи: | |||
*# <math>(\forall a \in \mathbb{R}) P(X = a) = 0</math> | |||
*#* Доказ: <math>P(X = a) = F(a) - F(a^{-}) = 0</math> | |||
*# <math>(\forall a, b \in \mathbb{R}, a < b) P(X \in (a, b)) = \int_a^b f(t) dt = P(X \in [a, b)) = P(X \in (a, b]) = P(X \in [a, b])</math> | |||
*#* Доказ: ако интеграл представимо површином испод функције, није нам битно да ли избацимо нула, једну или две дужи из те површине. | |||
*# <math>P(x < a) = P(x \leq a)</math> и <math>P(x > a) = P(x \geq a)</math> | |||
*# <math>\int_{-\infty}^{+\infty} f(x) dx = 1</math> | |||
* '''Теорема 3.2:''' ако је <math>F(x)</math> дефинисана на <math>\mathbb{R}</math>, непрекидна са десне стране и ако је <math>\lim_{x \to +\infty} F(x) = 1</math> а <math>\lim_{x \to -\infty} F(x) = 0</math>, тада постоји случајна променљива којој је <math>F(x)</math> функција расподеле. | |||
=== Расподеле === | |||
# '''Бернулијева:''' <math>X \sim Bern(p)</math> (Бернулијева расподела са вероватноћом успеха <math>p</math>) | |||
#* Закон: <math>X: \begin{pmatrix} | |||
0 & 1 \\ | |||
1 - p & p | |||
\end{pmatrix}</math> | |||
#* Модел: индикатор догађаја, <math>I_A = \left\{ \begin{matrix} | |||
1, & \text{sa ver.} p = P(A) \\ | |||
0, & \text{sa ver.} q = 1-p = P(\overline{A}) | |||
\end{matrix}\right.</math> | |||
# '''Биномна:''' <math>X \sim Bin(n, p), n \in \mathbb{N}, 0 < p < 1, X \in \{0, 1, ..., n\}</math> | |||
#* Закон: <math>P(X = k) = \binom{n}{k} p^k q^{n-k}, q = 1 - p</math> | |||
#* Модел: Бернулијева шема је низ Бернулијевих (независних) експеримената, и у сваком експерименту догађај <math>A</math> има вероватноћу <math>P(A) = p</math>, а наша случајна променљива јесте број реализација догађаја <math>A</math> у <math>n</math> изведених експеримената. | |||
# '''Пуасонова:''' <math>X \sim Poiss(\lambda), \lambda > 0</math> | |||
#* Закон: <math>P(X = k) = e^{-\lambda}\frac{\lambda^k}{k!}</math> | |||
#* Модел: број ретких догађаја у јединици времена, тако да је <math>\lambda</math> просечан број догађаја | |||
# '''Геометријска:''' <math>X \sim G(p), X \in \mathbb{N}</math> | |||
#* Закон: <math>P(X = n) = q^{n-1} p</math> | |||
#* Модел: изводе се Бернулијеви експерименти до првог успеха, а наша случајна променљива је број неуспеха | |||
# '''Паскалова (обрнута биномна):''' | |||
#* Закон: <math>P(X = n) = \binom{n-1}{k-1} p^k q^{n-k}</math> | |||
#* Модел: број Бернулијевих експеримената до <math>k</math>-тог успеха. | |||
# '''Хипергеометријска:''' | |||
#* Модел: на располагању је <math>n</math> предмета од којих је <math>m</math> једне а <math>n-m</math> друге врсте, од њих бирамо <math>k</math> предмета (<math>k < m, k < n-m</math>) и случајна променљива нам је број предмета прве врсте међу изабраним | |||
#* Закон: <math>P(X = r) = \frac{\binom{m}{r}\binom{n-m}{k-r}}{\binom{n}{k}}</math> | |||
# '''(Дискретна) униформна:''' | |||
#* Закон: <math>P(X = x_i) = \frac{1}{n}</math>, за <math>X = \{x_1, x_2, ..., x_n\}</math> | |||
# '''(Непрекидна) униформна:''' <math>X \sim Unif[a, b], a, b \in \mathbb{R}, a < b</math> | |||
#* Закон: <math>f(x) = \left\{\begin{matrix} | |||
\frac{1}{b - a}, & x \in [a, b] \\ | |||
0 & x \notin [a, b] | |||
\end{matrix}\right.</math> (<math>X</math> је концентрисана на <math>[a, b]</math>) | |||
#** <math>F(x) = \left\{\begin{matrix} | |||
0, & x < a \\ | |||
\frac{x - a}{b - a}, & a \leq x \leq b \\ | |||
1, & x > b | |||
\end{matrix}\right.</math> | |||
#* Модел: бирамо број из <math>[a, b]</math>, а случајна променљива нам је да ли је број у <math>[a, x]</math> (где је <math>a < x < b</math>) | |||
# '''Експоненцијална:''' <math>X \sim Exp(\lambda), \lambda > 0</math> | |||
#* Модел: време између Пуасонових догађаја, где је <math>\lambda</math> реципрочно просечно време | |||
#* Закон: <math>f(x) = \left\{\begin{matrix} | |||
\lambda e^{-\lambda x}, & x \geq 0 \\ | |||
0, & x < 0 | |||
\end{matrix}\right.</math> | |||
#** <math>F(x) = \left\{\begin{matrix} | |||
0, & x < 0 \\ | |||
1 - e^{-\lambda x}, & x \geq 0 | |||
\end{matrix}\right.</math> | |||
#* Особина одсуства меморије: <math>P(X > s + t | X > s) = P(X > t), s, t > 0</math> | |||
# '''Стандардна нормална (стандардна Гаусова):''' <math>Z \sim \mathcal{N}(0, 1)</math> | |||
#* Закон: <math>f(x) = \frac{1}{\sqrt{2\pi}} e^{-\frac{x^2}{2}}</math> | |||
#** <math>\Phi(x) = \int_{-\infty}^x = \frac{1}{\sqrt{2\pi}} e^{-\frac{x^2}{2}} dx</math> ('''неизрачунљиво''', али се рачуна на основу таблице, с тим што <math>x \geq 3.5 \implies \Phi(x) \approx 1</math> и <math>x < 0 \implies \Phi(-x) + \Phi(x) = 1</math>) | |||
{| class="wikitable" | |||
|+ Вредности <math>\Phi(x)</math> (пример: <math>\Phi(1.43) = 0.9236</math>) | |||
! X !! 0 !! 1 !! 2 !! 3 !! 4 !! 5 !! 6 !! 7 !! 8 !! 9 | |||
|- | |||
| 0.0 || 5000 || 5040 || 5080 || 5120 || 5160 || 5199 || 5239 || 5279 || 5319 || 5359 | |||
|- | |||
| 0.1 || 5398 || 5438 || 5478 || 5517 || 5557 || 5596 || 5636 || 5675 || 5714 || 5753 | |||
|- | |||
| 0.2 || 5793 || 5832 || 5871 || 5910 || 5948 || 5987 || 6026 || 6064 || 6103 || 6141 | |||
|- | |||
| 0.3 || 6179 || 6217 || 6255 || 6293 || 6331 || 6368 || 6406 || 6443 || 6480 || 6517 | |||
|- | |||
| 0.4 || 6554 || 6591 || 6628 || 6664 || 6700 || 6736 || 6772 || 6808 || 6844 || 6879 | |||
|- | |||
| 0.5 || 6915 || 6950 || 6985 || 7019 || 7054 || 7088 || 7123 || 7157 || 7190 || 7224 | |||
|- | |||
| 0.6 || 7257 || 7291 || 7324 || 7357 || 7389 || 7422 || 7454 || 7486 || 7517 || 7549 | |||
|- | |||
| 0.7 || 7580 || 7611 || 7642 || 7673 || 7704 || 7734 || 7764 || 7794 || 7823 || 7852 | |||
|- | |||
| 0.8 || 7881 || 7910 || 7939 || 7967 || 7995 || 8023 || 8051 || 8078 || 8106 || 8133 | |||
|- | |||
| 0.9 || 8159 || 8186 || 8212 || 8238 || 8264 || 8289 || 8315 || 8340 || 8365 || 8389 | |||
|- | |||
| 1.0 || 8413 || 8438 || 8461 || 8485 || 8508 || 8531 || 8554 || 8577 || 8599 || 8621 | |||
|- | |||
| 1.1 || 8643 || 8665 || 8686 || 8708 || 8729 || 8749 || 8770 || 8790 || 8810 || 8830 | |||
|- | |||
| 1.2 || 8849 || 8869 || 8888 || 8907 || 8925 || 8944 || 8962 || 8980 || 8997 || 9015 | |||
|- | |||
| 1.3 || 9032 || 9049 || 9066 || 9082 || 9099 || 9115 || 9131 || 9147 || 9162 || 9177 | |||
|- | |||
| 1.4 || 9192 || 9207 || 9222 || 9236 || 9251 || 9265 || 9279 || 9292 || 9306 || 9319 | |||
|- | |||
| 1.5 || 9332 || 9345 || 9357 || 9370 || 9382 || 9394 || 9406 || 9418 || 9429 || 9441 | |||
|- | |||
| 1.6 || 9452 || 9463 || 9474 || 9484 || 9495 || 9505 || 9515 || 9525 || 9535 || 9545 | |||
|- | |||
| 1.7 || 9554 || 9564 || 9573 || 9582 || 9591 || 9599 || 9608 || 9616 || 9625 || 9633 | |||
|- | |||
| 1.8 || 9641 || 9649 || 9656 || 9664 || 9671 || 9678 || 9686 || 9693 || 9699 || 9706 | |||
|- | |||
| 1.9 || 9713 || 9719 || 9726 || 9732 || 9738 || 9744 || 9790 || 9756 || 9761 || 9767 | |||
|- | |||
| 2.0 || 97725 || 97778 || 97831 || 97882 || 97932 || 97982 || 98030 || 98077 || 98124 || 98169 | |||
|- | |||
| 2.1 || 98214 || 98257 || 98300 || 98341 || 98382 || 98422 || 98461 || 98500 || 98537 || 98574 | |||
|- | |||
| 2.2 || 98610 || 98645 || 98679 || 98713 || 98745 || 98778 || 98809 || 98840 || 98870 || 98899 | |||
|- | |||
| 2.3 || 98928 || 98956 || 98983 || 99010 || 99036 || 99061 || 99086 || 99111 || 99134 || 99158 | |||
|- | |||
| 2.4 || 99180 || 99202 || 99224 || 99245 || 99266 || 99286 || 99305 || 99324 || 99343 || 99361 | |||
|- | |||
| 2.5 || 99379 || 99396 || 99413 || 99430 || 99446 || 99461 || 99477 || 99492 || 99506 || 99520 | |||
|- | |||
| 2.6 || 99534 || 99547 || 99560 || 99573 || 99585 || 99598 || 99609 || 99621 || 99632 || 99643 | |||
|- | |||
| 2.7 || 99653 || 99664 || 99674 || 99683 || 99693 || 99702 || 99711 || 99720 || 99728 || 99736 | |||
|- | |||
| 2.8 || 99744 || 99752 || 99760 || 99767 || 99774 || 99781 || 99788 || 99795 || 99801 || 99807 | |||
|- | |||
| 2.9 || 99813 || 99819 || 99825 || 99831 || 99836 || 99841 || 99846 || 99851 || 99856 || 99861 | |||
|- | |||
| 3.0 || 998650 || 998694 || 998736 || 998777 || 998817 || 998856 || 998893 || 998930 || 998965 || 998999 | |||
|- | |||
| 3.1 || 999032 || 999065 || 999096 || 999126 || 999155 || 999184 || 999211 || 999238 || 999264 || 999289 | |||
|- | |||
| 3.2 || 999313 || 999336 || 999359 || 999381 || 999402 || 999423 || 999443 || 999462 || 999481 || 999499 | |||
|- | |||
| 3.3 || 999517 || 999534 || 999550 || 999566 || 999581 || 999596 || 999610 || 999624 || 999638 || 999651 | |||
|- | |||
| 3.4 || 999663 || 999675 || 999687 || 999698 || 999709 || 999720 || 999730 || 999740 || 999749 || 999758 | |||
|} | |||
=== Случајни вектори === | |||
* '''Случајни вектор:''' скуп случајних променљивих дефинисаних на истом скупу исхода | |||
* '''Заједнички закон расподеле:''' одређен је ако су познате све вероватноће <math>p_{ij} = P(X = x_i, Y = y_j)</math> за све вредности <math>x_i</math> и <math>y_j</math> које случајне променљиве узимају | |||
* '''Маргинални закони расподеле:''' појединачни закони расподеле случајних променљивих у вектору, добијени из заједничког закона као <math>P(X = x_i) = p_{i1} + p_{i2} + ...</math> | |||
* '''Заједничка функција расподеле:''' <math>F(x, y) = P(X \leq x, Y \leq y)</math> за све <math>x, y \in \mathbb{R}</math> | |||
* '''Заједничка функција густине:''' Ако постоји ненегативна функција <math>f(x, y)</math> дефинисана за <math>X, Y \in \mathbb{R}</math> таква да <math>(\forall (x, y) \in \mathbb{R}^2) F(x, y) = \int_{-\infty}^x \int_{-\infty}^y f(x, y) dx dy</math> онда је <math>(X, Y)</math> непрекидан случајни вектор а <math>f(x, y)</math> његова заједничка густина. Њене особине су: | |||
*# <math>\int_{-\infty}^{+\infty} \int_{-\infty}^{+\infty} f(x, y) = 1</math> | |||
*# <math>f(x, y) = \frac{\partial^2 F(x, y)}{\partial x \partial y}</math> | |||
*# <math>P((X, Y) \in D) = \int_D \int_D f(x, y) dx dy</math> | |||
* '''Маргиналне функције густине:''' <math>f_X(x) = \int_{-\infty}^{+\infty} f(x, y) dy</math> | |||
=== Независност случајних променљивих === | |||
* <math>X_1, X_2, ..., X_n</math> су независне ако су догађаји <math>X_1 \in A_1, X_2 \in A_2, ...X_n \in A_n</math> независни за све могуће <math>A_1, A_2, ..., A_n \subset \mathbb{R}</math> | |||
* '''Услови независности:''' | |||
*# Ако у свакој тачки <math>(x, y) \in \mathbb{R}^2</math> важи <math>F(x, y) = F_X(x) F_Y(y)</math> где је <math>F</math> заједничка функција расподеле а <math>F_X, F_Y</math> су маргиналне функције расподеле. | |||
*# Ако су <math>X</math> и <math>Y</math> дискретне и важи <math>P(X = x_i, Y = y_i) = P(X = x_i) P(Y = y_1)</math> за све вредности <math>x_i</math> и <math>y_j</math>. | |||
*# Ако су <math>X</math> и <math>Y</math> непрекидне и важи <math>(\forall (x, y) \in \mathbb{R}^2) f(x, y) = f_X(x) f_Y(y)</math> где је <math>f</math> заједничка функција густине а <math>f_X, f_Y</math> су маргиналне функције густине. | |||
=== Варијациони низ === | |||
* Ако су <math>X_1, X_2, ... X_n</math> независне случајне променљиве са истом расподелом које означавају вредности добијене у неким догађајима (на пример, резултати бацања коцкице), онда променљиве <math>X_{(1)}, X_{(2)}, ... X_{(n)}</math> које носе вредност најмање од ових променљивих, друге најмање од ових променљивих, ... редом чине варијациони низ. | |||
** Променљиве варијационог низа немају исту расподелу као оригиналне случајне променљиве, и више нису независне. | |||
* '''Функција расподеле <math>k</math>-те случајне променљиве варијационог низа:''' <math>F_k(x) = \sum_{j = k}^n \binom{n}{j} F(x)^j (1 - F(x))^{n - j}</math> | |||
* Специјални случајеви: | |||
** Функција расподеле најмање случајне променљиве варијационог низа: <math>F_{min}(x) = 1 - (1 - F(x))^n</math> | |||
** Функција расподеле највеће случајне променљиве варијационог низа: <math>F_{max}(x) = F(x)^n</math> | |||
== Нумеричке карактеристике случајних променљивих == | |||
=== Математичко очекивање === | |||
* За дискретну случајну променљиву <math>X</math> са коначним скупом вредности <math>\{x_1, x_2, ..., x_n\}</math>, математичко очекивање је дефинисано са <math>EX = \sum_{k = 1}^n x_k P(X = x_k)</math> | |||
* За дискретну случајну променљиву <math>X</math> са бесконачним скупом вредности, математичко очекивање је дефинисано са <math>EX = \sum_k x_k P(X = x_k)</math> (под условом да овај ред апсолутно конвергира) | |||
* За непрекидну случајну променљиву <math>X</math> са густином <math>f(x)</math>, математичко очекивање је дефинисано са <math>EX = \int_{-\infty}^{+\infty} xf(x)dx</math> (под условом да овај интеграл апсолутно конвергира) | |||
* '''Теорема 4.1:''' Нека је <math>X</math> непрекидна случајна променљива са густином <math>f(x)</math> и <math>g</math> функција за коју постоји <math>E(g(X))</math>. Тада је: <math>E(g(X)) = \int_{-\infty}^{+\infty} g(x) f(x) dx</math>. | |||
* '''Теорема 4.2:''' Нека су <math>X</math> и <math>Y</math> случајне променљиве са очекивањима <math>EX</math> и <math>EY</math>, а <math>a, b, c \in \mathbb{R}</math>. Тада важи: | |||
*# <math>E(c) = c</math> | |||
*# <math>E(aX) = aEX</math> | |||
*# <math>E(X + Y) = EX + EY</math> | |||
*# Ако су <math>X</math> и <math>Y</math> независне, онда је <math>E(XY) = EX EY</math> | |||
=== Варијанса === | |||
* '''Варијанса (дисперзија):''' за променљиву <math>X</math> са очекивањем <math>EX</math>, варијанса је <math>VarX = E(X - EX)^2</math> | |||
** '''Стандардна девијација (стандардно одступање):''' <math>S.D.(X) = \sqrt{VarX}</math> | |||
* Особине варијансе за <math>a, c \in \mathbb{R}</math>: | |||
*# <math>Var(c) = 0</math> | |||
*#* Доказ: <math>Var(c) = E(c - E(c))^2 = E(c - c)^2 = 0</math> | |||
*# <math>VarX = 0 \implies P(X = c) = 1</math> за неко <math>c</math> | |||
*#* Доказ: није доказивано. | |||
*# <math>VarX = E(X^2) - (EX)^2</math> | |||
*#* Доказ: <math>VarX = E(X - EX)^2 =</math><math> E(X^2 - 2EX \cdot X + (EX)^2) =</math><math>E(X^2) + E(-2EX \cdot X) + E((EX)^2) =</math><math> E(X^2) - 2EX \cdot EX + (EX)^2 =</math><math> E(X^2) - (EX)^2</math> | |||
*# <math>Var(X + a) = VarX</math> | |||
*# <math>Var(aX) = a^2 VarX</math> | |||
*# Ако су <math>X</math> и <math>Y</math> независне са коначним варијансама, онда је <math>Var(X + Y) = VarX + VarY</math> | |||
* '''Коваријанса:''' <math>Cov(X, Y) = E[(X - EX)(Y - EY)]</math> (одступање од очекиване вредности обе променљиве) | |||
** '''Теорема 4.3:''' <math>Cov(X, Y) = E(XY) - EX \cdot EY</math> | |||
*** Доказ: <math>Cov(X, Y) =</math><math> E(XY - EX \cdot Y - X \cdot EY + EX \cdot EY) =</math><math> E(XY) + E(-EX \cdot Y) + E(-X \cdot EY) + E(EX \cdot EY) =</math><math> E(XY) - EX \cdot EY - EY \cdot EX + EX \cdot EY =</math><math> E(XY) - EX \cdot EY</math> | |||
** '''Теорема 4.4:''' <math>Var(X + Y) = VarX + VarY + 2Cov(X, Y)</math> | |||
*** Доказ: <math>Var(X + Y) =</math><math> E(X + Y - E(X + Y))^2 =</math><math> E(X + Y - EX - EY)^2 =</math><math> E((X - EX) + (Y - EY))^2 =</math><math> E((X - EX)^2 + 2(X - EX)(Y - EY) + (Y - EY)^2) =</math><math> VarX + VarY + 2Cov(X, Y)</math> | |||
* Особине коваријансе за променљиве <math>X, Y, Z</math> и <math>a, b \in \mathbb{R}</math>: | |||
*# Ако су <math>X</math> и <math>Y</math> независне, <math>Cov(X, Y) = 0</math>. | |||
*# <math>Cov(X, Y) = Cov(Y, X)</math> | |||
*# <math>Cov(X, X) = VarX</math> | |||
*# <math>Cov(aX, bY) = abCov(X, Y)</math> | |||
*# <math>Cov(X + Y, Z) = Cov(X, Z) + Cov(Y, Z)</math> | |||
*# <math>Cov(X + a, Y + b) = Cov(X, Y)</math> | |||
* '''Коефицијент корелације:''' <math>\rho(X, Y) = \frac{Cov(X, Y)}{\sqrt{VarX} \sqrt{VarY} }</math> (за <math>VarX, VarY > 0</math>) | |||
** '''Теорема 4.5:''' | |||
**# <math>-1 \leq \rho(X, Y) \leq 1</math> | |||
**#* Доказ: уочимо случајну променљиву <math>\frac{X}{\sqrt{VarX} } + \frac{Y}{\sqrt{VarY} }</math>. <math>0 \leq Var\left(\frac{X}{\sqrt{VarX} } + \frac{Y}{\sqrt{VarY} }\right) =</math><math> Var\left(\frac{X}{\sqrt{VarX} }\right) + Var\left(\frac{Y}{\sqrt{VarY} }\right) + 2Cov\left(\frac{X}{\sqrt{VarX} }, \frac{Y}{\sqrt{VarY} }\right) =</math><math> \frac{1}{\sqrt{VarX}^2} \cdot VarX + \frac{1}{\sqrt{VarY}^2} \cdot VarY + \frac{2}{\sqrt{VarX} \cdot \sqrt{VarY} } Cov(X, Y) =</math><math> 2 + 2\rho(X, Y)</math>. Како је <math>2 + 2\rho(X, Y) \geq 0</math>, онда важи <math>\rho \geq -1</math>. Аналогно томе, уколико уочимо случајну променљиву са - уместо + добијамо <math>\rho \leq 1</math>. | |||
**# <math>\rho(X, Y) = \pm 1</math> ако и само ако <math>P(Y = aX + b) = 1</math>, где је <math>\DeclareMathOperator{\sgn}{sgn}a \neq 0, b \in \mathbb{R}, \sgn a = \sgn \rho(X, Y)</math> | |||
**# <math>\rho(aX + b, cY + d) = \pm \rho(X, Y)</math> за <math>a, c \in \mathbb{R} \setminus \{0\}, b, d \in \mathbb{R}</math>, где се узима знак плус ако је <math>ac</math> позитивно, а минус у супротном | |||
** Корелација: | |||
*** <math>\rho(X, Y) = 0 \implies</math> променљиве су некорелисане | |||
*** <math>\rho(X, Y) > 0 \implies</math> променљиве су позитивно корелисане | |||
*** <math>\rho(X, Y) < 0 \implies</math> променљиве су негативно корелисане | |||
** '''Моменти:''' | |||
*** <math>E(X^k)</math>: моменат реда <math>k</math> | |||
*** <math>E|X|^k</math>: апсолутни моменат реда <math>k</math> | |||
*** <math>E(X - EX)^k</math>: централни моменат реда <math>k</math> | |||
** '''Квантили:''' за дату случајну променљиву <math>X</math> са расподелом <math>F(x)</math>, квантил реда <math>p</math> је сваки број <math>x</math> за који важи <math>F(x^-) \leq p \leq F(x)</math>. | |||
*** За сваку расподелу и за свако <math>p</math> постоји бар један квантил тог реда. | |||
*** Ознака: <math>\varepsilon_p</math> | |||
*** <math>\varepsilon_{\frac{1}{2} }</math>: медијана (мера средње вредности) | |||
*** <math>\varepsilon_{\frac{1}{4} }</math>: први квартил | |||
*** <math>\varepsilon_{\frac{3}{4} }</math>: други квартил | |||
=== Нумеричке карактеристике расподела === | |||
{| class="wikitable" | |||
|+ Нумеричке карактеристике честих расподела | |||
! Расподела | |||
! Математичко очекивање | |||
! Варијанса | |||
|- | |||
| <math>Bern(p)</math> | |||
| <math>p</math> | |||
| <math>qp</math> | |||
|- | |||
| <math>Bin(n, p)</math> | |||
| <math>np</math> | |||
| <math>npq</math> | |||
|- | |||
| <math>Poiss(\lambda)</math> | |||
| <math>\lambda</math> | |||
| <math>\lambda</math> | |||
|- | |||
| <math>Exp(\lambda)</math> | |||
| <math>\frac{1}{\lambda}</math> | |||
| <math>\frac{1}{\lambda^2}</math> | |||
|- | |||
| <math>Unif(a, b)</math> | |||
| <math>\frac{a+b}{2}</math> | |||
| <math>\frac{(b-a)^2}{12}</math> | |||
|- | |||
| <math>\mathcal{N}(\mu, \sigma^2)</math> | |||
| <math>\mu</math> | |||
| <math>\sigma^2</math> | |||
|} | |||
== Карактеристичне функције == | |||
* Дефинише се као <math>\varphi_X(t) = Ee^{itX}</math>. | |||
** За дискретно <math>X</math>: <math>\varphi_X = \sum_k e^{itx_k} P(X = x_k)</math> за све вредности <math>x_k</math> | |||
** За непрекидно <math>X</math>: <math>\varphi_X = \int_{-\infty}^{+\infty} e^{itx} f(x) dx</math>, где <math>f(x)</math> означава густину | |||
* '''Теорема 5.1:''' | |||
*# За сваку случајну променљиву постоји одговарајућа карактеристична функција | |||
*# Различитим карактеристичним функцијама одговарају различите расподеле и обрнуто | |||
*# За сваку случајну променљиву и свака два реална или комплексна броја важи <math>\varphi_{aX+b}(t) = e^{ibt} \varphi_X(at)</math> | |||
*# Ако случајна променљива има момент реда <math>n</math> тада важи <math>E(X^n) = i^{-n} \varphi^{(n)}(0)</math> | |||
*# За две независне случајне променљиве важи <math>\varphi_{X + Y}(t) = \varphi_X(t) \varphi_Y(t)</math> | |||
*#* Доказ: <math>\varphi_{X + Y}(t) = Ee^{it(X+Y)} = Ee^{itX} Ee^{itY} = \varphi_X(t) \varphi_Y(t)</math> | |||
== Граничне теореме == | |||
* Низ случајних променљивих <math>\{X_n\}</math>: | |||
** '''строго конвергира''' (конвергира скоро свуда) ка <math>X</math> ако <math>P\left(\lim_{n \to \infty} X_n = X\right) = 1</math> | |||
** '''конвергира у вероватноћи''' ка <math>X</math> ако је <math>\lim_{n \to \infty} P\left(\left|X_n - X\right|\geq \varepsilon\right) = 0</math> за свако <math>\varepsilon > 0</math> | |||
** '''конвергира у расподели''' (слабо конвергира) ка <math>X</math> ако <math>\lim_{n \to \infty} F_{X_n}(x) = F_X(x)</math> у свакој тачки <math>x \in \mathbb{R}</math> у којој је <math>F_X(x)</math> непрекидна | |||
** '''<math>L_p</math>-конвергира''' ка <math>X</math> за <math>p \geq 1</math> ако <math>\lim_{n \to \infty} E\left|X_n - X\right|^p = 0</math> | |||
*** За <math>p = 2</math> се каже да '''конвергира у средњем квадратном''' ка <math>X</math> | |||
* Из строге конвергенције следи конвергенција у вероватноћи, из конвергенције у вероватноћи следи конвергенција у расподели, а из <math>L_p</math> конвергенције такође следи конвергенција у вероватноћи. | |||
* '''Теорема 6.1:''' (теорема о непрекидности) Нека је <math>X_n</math> низ случајних променљивих са карактеристичним функцијама <math>\varphi_n</math> и нека је <math>X</math> случајна променљива са карактеристичном функцијом <math>\varphi</math>. Низ <math>X_n</math> конвергира у расподели ка <math>X</math> ако и само ако је <math>\lim_{n \to \infty} \varphi_n(t) = \varphi(t)</math> за свако <math>t \in \mathbb{R}</math>. | |||
* '''Теорема 6.2:''' (апроксимација биномне расподеле Пуасоновом) ако <math>X \sim Bin(n, p)</math> и ако <math>np < 5, n \geq 30</math> онда <math>X \sim Poiss(np)</math> | |||
* '''Теорема 6.3:''' (неједнакост Маркова) ако је <math>X</math> ненегативна случајна променљива и постоји <math>EX</math>, онда <math>P(X \geq \varepsilon) \leq \frac{EX}{\varepsilon}</math> за свако <math>\varepsilon > 0</math> | |||
* '''Теорема 6.4:''' (неједнакост Чебишева) ако постоји <math>VarX</math>, тада је <math>P\left(\left|X - EX\right| \geq \varepsilon\right) \leq \frac{VarX}{\varepsilon^2}</math> за свако <math>\varepsilon > 0</math> | |||
** Доказ: на основу неједнакости Маркова, <math>P\left(\left|X - EX\right| \geq \varepsilon\right) = P((X - EX)^2 \geq \varepsilon^2) \leq \frac{E(X - EX)^2}{\varepsilon^2} = \frac{VarX}{\varepsilon^2}</math> | |||
* '''Теорема 6.5:''' (слаби закон великих бројева) Нека су <math>X_1, X_2...</math> независне случајне променљиве са истим очекивањем <math>\mu</math> и са коначним варијансама <math>VarX_k \leq V</math> за свако <math>k \in \mathbb{N}</math>, где је <math>V</math> позитивна константа. Тада низ аритметичких средина <math>\frac{X_1 + ... + X_n}{n}</math> конвергира у вероватноћи ка <math>\mu</math>. | |||
* '''Теорема 6.6:''' (Борелов строги закон великих бројева) Ако је <math>S_n</math> број успеха у <math>n</math> Бернулијевих експеримената са вероватноћом успеха <math>p</math>. тада је <math>P\left(\lim_{n \to \infty} \frac{S_n}{n} = p\right) = 1</math> | |||
* '''Теорема 6.7:''' (Коломогоровљев строги закон великих бројева) | |||
*# Ако су <math>X_1, ..., X_n</math> независне случајне променљиве са истом расподелом и очекивањем <math>\mu</math>, тада важи <math>P\left(\lim_{n \to \infty} \frac{X_1 + ... + X_n}{n} = \mu\right) = 1</math> | |||
*# Ако су <math>X_1, ..., X_n</math> независне случајне променљиве са истом расподелом и ако постоји <math>b</math> такав да је <math>P\left(\lim_{n \to \infty} \frac{X_1 + ... + X_n}{n} = b\right) = 1</math>, тада све променљиве имају очекивање <math>b</math> | |||
* '''Теорема 6.8:''' (централна гранична теорема) Ако су <math>X_1, X_2...</math> независне, са истом расподелом, очекивањем <math>\mu</math> и коначним варијансама <math>\sigma^2</math>, тада <math>Z_n = \frac{X_1 + ... + X_n - n\mu}{\sigma \sqrt{n} }</math> конвергира у расподели ка <math>Z \sim \mathcal{N}(0, 1)</math>. | |||
** У пракси мора да важи <math>n \geq 30</math>. | |||
* '''Теорема 6.9:''' (апроксимација биномне расподеле нормалном, Моавр-Лапласова теорема) Ако је <math>X \sim Bin(n, p)</math> и <math>Z_n = \frac{X - np}{\sqrt{npq} }</math> тада <math>Z_n</math> конвергира у расподели ка <math>Z \sim \mathcal{N}(0, 1)</math> | |||
** Доказ: следи из централне граничне теореме, <math>X = X_1 + ... + X_n, X_1, ..., X_n \sim Bern(p)</math> | |||
* '''Апроксимација Пуасонове расподеле нормалном:''' <math>X \sim Poiss(\lambda), \lambda \geq 10 \implies X \sim \mathcal{N}(\lambda, \lambda)</math> | |||
== Статистика == | |||
=== Основни појмови === | |||
* '''Популација:''' скуп <math>\Omega</math> елемената <math>\omega</math> (паралела из вероватноће: скуп исхода) | |||
* '''Обележје:''' нумеричка особина <math>X(\omega)</math> елемената <math>\omega \in \Omega</math> (паралела из вероватноће: случајна променљива) | |||
* '''Статистички експеримент (у пракси):''' регистровање вредности <math>X</math> на неком (правом) подскупу скупа <math>\Omega</math>, који називамо '''узорак'''. На основу узорка доносимо закључке о расподели <math>X</math>. | |||
* '''Случајни узорак''' димензије <math>n</math> је скуп независних случајних променљивих са истом расподелом. | |||
** '''Реализовани узорак''' представља реализоване вредности случајних променљивих у посматраном експерименту. | |||
* '''Статистика''' је случајна променљива <math>f(X_1, X_2, ..., X_n)</math> која зависи само од случајних променљивих из узорка, не и од непознатих параметара расподеле. | |||
** Њена расподела сме да зависи од ових параметара. | |||
** '''Реализована вредност статистике:''' <math>f(x_1, x_2, ..., x_n)</math> | |||
=== Оцене параметара === | |||
* Обележје <math>X</math> има расподелу <math>P_{\theta}</math> која зависи од скупа параметара <math>\theta \in \Theta</math>. | |||
** <math>\Theta</math>: скуп допустивих расподела | |||
** <math>P_{\theta}</math>: фамилија расподела | |||
** Ако не знамо <math>\theta</math> можемо да бирамо узорак и на основу њега оцењујемо <math>\theta</math>. | |||
==== Тачкаста оцена ==== | |||
* Реализована вредност статистике <math>\hat{\theta}(X_1, ..., X_n)</math> | |||
* Карактеристике: | |||
*# <math>\hat{\theta}(X_1, ..., X_n)</math> је центрирана (непристрасна) ако је <math>E\hat{\theta} = \theta</math> за свако <math>\theta</math>. | |||
*# <math>\hat{\theta}(X_1, ..., X_n)</math> је асимптотски непристрасна ако <math>E\hat{\theta} \to_{n \to \infty} \theta</math>. | |||
*# <math>\hat{\theta}(X_1, ..., X_n)</math> је стабилна (постојана) ако конвергира у вероватноћи ка <math>\theta</math>. | |||
*# Ако су <math>\hat{\theta_1}</math> и <math>\hat{\theta_2}</math> две оцене истог параметра <math>\theta</math>, <math>\hat{\theta_1}</math> је боља од <math>\hat{\theta_2}</math> ако је <math>E(\hat{\theta_1} - \theta)^2 \leq E(\hat{\theta_2} - \theta)^2</math> с тим што строга неједнакост важи за бар једно <math>\theta</math>. | |||
*# Ако су <math>\hat{\theta_1}</math> и <math>\hat{\theta_2}</math> две центриране оцене истог параметра <math>\theta</math>, кажемо да је <math>\hat{\theta_1}</math> ефикасније од <math>\hat{\theta_2}</math> ако је <math>Var\hat{\theta_1} \leq Var\hat{\theta_2}</math> с тим што строга неједнакост важи за бар једно <math>\theta</math>. | |||
==== Интервална оцена ==== | |||
* '''Интервал поверења:''' је интервал који, за дат узорак обима <math>n</math> из расподеле <math>P_{\theta}</math>, садржи непознати параметар <math>\theta</math> са вероватноћом <math>1-\alpha</math>. | |||
** Двострани интервал поверења: <math>[A, B]</math> | |||
** Једнострани интервал поверења: <math>(-\infty, B]</math> или <math>[A, +\infty)</math> | |||
** <math>A</math> и <math>B</math> су статистике. | |||
* '''Студентова <math>t</math>-расподела:''' | |||
** <math>f(x) = \frac{\Gamma\left(\frac{n+1}{2}\right)}{\sqrt{n\pi} \Gamma\left(\frac{n}{2}\right)} \left(1 + \frac{x^2}{n}\right)^{-\frac{n+1}{2}}</math> | |||
** Гама функција: <math>\Gamma(x) = \int_0^{+\infty} e^{-t} t^{x-1} dt</math> | |||
*** <math>\Gamma(x+1) = x\Gamma(x) \implies \Gamma(n) = (n-1)!</math> | |||
*** <math>\Gamma(1) = 1</math> | |||
*** <math>\Gamma\left(\frac{1}{2}\right) = \sqrt{\pi}</math> | |||
** За <math>n \geq 30</math> можемо апроксимирати са <math>\mathcal{N}(0, 1)</math> | |||
** '''Теорема 7.1:''' Ако су <math>X_1, ..., X_n \sim \mathcal{N}(\mu, \sigma^2)</math> са непознатим <math>\mu</math> и <math>\sigma</math>, нека је <math>\hat{\mu} = \frac{X_1 + ... + X_n}{n}</math> и <math>s^2 = \frac{1}{n-1} \sum_{k = 1}^n (X_k - \hat{\mu})^2</math>, тада важи <math>\frac{\hat{\mu} - \mu}{\frac{s}{\sqrt{n}}} \sim t(n-1)</math>. | |||
* '''Хи квадрат расподела:''' | |||
** <math>f(x) = \begin{cases} | |||
\frac{1}{2^{\frac{n}{2}} \Gamma\left(\frac{n}{2}\right)} x^{\frac{n}{2} - 1} e^{-\frac{x}{2}}, & x > 0 \\ | |||
0, & x \leq 0 | |||
\end{cases}</math> | |||
** '''Теорема 7.2:''' Ако су <math>Z_1, Z_2, ..., Z_n \sim \mathcal{N}(0, 1)</math>, њихов збир има расподелу <math>\chi^2(n)</math>. | |||
** '''Теорема 7.3:''' Ако су <math>X_1, X_2, ..., X_n \sim \mathcal{N}(\mu, \sigma^2)</math> са непознатим <math>\sigma^2</math>: | |||
*** Ако је <math>\mu</math> познато: <math>\frac{nS_0^2}{\sigma^2} \sim \chi^2(n)</math> | |||
*** Ако је <math>\mu</math> непознато: <math>\frac{(n-1)s^2}{\sigma^2} \sim \chi^2(n-1)</math> | |||
{| class="wikitable" | |||
|+ Процена непознатих параметара у интервалима поверења код <math>\mathcal{N}(\mu, \sigma^2)</math>. | |||
! colspan="2" | Процена | |||
! Двострани интервал | |||
! Једнострани интервал | |||
|- | |||
! rowspan="3" | Процена непознатог <math>\mu</math> | |||
! Познато <math>\sigma^2</math> | |||
| <math>\mu \in \left[\hat{\mu} - \varepsilon_{1 - \frac{\alpha}{2}} \frac{\sigma}{\sqrt{n}}, \hat{\mu} + \varepsilon_{1 - \frac{\alpha}{2}} \frac{\sigma}{\sqrt{n}}\right]</math> | |||
| <math>\mu \in \left(-\infty, \hat{\mu} + \varepsilon_{1 - \alpha} \frac{\sigma}{\sqrt{n}}\right]</math> или <math>\mu \in \left[\hat{\mu} - \varepsilon_{1 - \alpha} \frac{\sigma}{\sqrt{n}}, +\infty\right)</math> | |||
|- | |||
! rowspan="2" | Непознато <math>\sigma^2</math> | |||
| colspan="2" | Процењујемо <math>\sigma^2</math>: <math>s^2 = \frac{1}{n-1} \sum_{k = 1}^n (X_k - \hat{\mu})^2</math>, <math>\frac{\hat{\mu} - \mu}{\frac{s}{\sqrt{n}}} \sim t(n-1)</math> | |||
|- | |||
| <math>\mu \in \left[\hat{\mu} - \varepsilon_{1 - \frac{\alpha}{2}} \frac{s}{\sqrt{n}}, \hat{\mu} + \varepsilon_{1 - \frac{\alpha}{2}} \frac{s}{\sqrt{n}}\right]</math> | |||
| <math>\mu \in \left(-\infty, \hat{\mu} + \varepsilon_{1 - \alpha} \frac{s}{\sqrt{n}}\right]</math> или <math>\mu \in \left[\hat{\mu} - \varepsilon_{1 - \alpha} \frac{s}{\sqrt{n}}, +\infty\right)</math> | |||
|- | |||
! rowspan="2" | Процена непознатог <math>\sigma^2</math> | |||
! Познато <math>\mu</math> | |||
| <math>\sigma^2 \in \left[\frac{nS_0^2}{\varepsilon_{1 - \frac{\alpha}{2}}}, \frac{nS_0^2}{\varepsilon_{\frac{\alpha}{2}}}\right]</math>, квантили из <math>\chi^2(n)</math> | |||
| <math>\sigma^2 \in \left[0, \frac{nS_0^2}{\varepsilon_{\alpha}}\right]</math> или <math>\sigma^2 \in \left[\frac{nS_0^2}{\varepsilon_{1 - \alpha}}, +\infty\right)</math>, квантили из <math>\chi^2(n)</math> | |||
|- | |||
! Непознато <math>\mu</math> | |||
| <math>\sigma^2 \in \left[\frac{(n-1)s^2}{\varepsilon_{1 - \frac{\alpha}{2}}}, \frac{(n-1)s^2}{\varepsilon_{\frac{\alpha}{2}}}\right]</math>, квантили из <math>\chi^2(n-1)</math> | |||
| <math>\sigma^2 \in \left[0, \frac{(n-1)s^2}{\varepsilon_{\alpha}}\right]</math> или <math>\sigma^2 \in \left[\frac{(n-1)s^2}{\varepsilon_{1 - \alpha}}, +\infty\right)</math>, квантили из <math>\chi^2(n-1)</math> | |||
|} | |||
* Ако расподела није <math>\mathcal{N}(\mu, \sigma^2)</math>, за <math>n > 30</math> важи централна гранична теорема, тако да можемо апроксимирати интервал поверења као за нормалну расподелу. | |||
{| class="wikitable" | |||
|+ Квантили студентове расподеле <math>t(n)</math> (за <math>n > 30</math> се апроксимира нормалном) | |||
! | |||
! colspan="6" | <math>u</math> | |||
|- | |||
! <math>n</math> !! 0.75 !! 0.90 !! 0.95 !! 0.975 !! 0.99 !! 0.995 | |||
|- | |||
| 1 || 1.000 || 3.078 || 6.314 || 12.706 || 31.821 || 63.657 | |||
|- | |||
| 2 || 0.816 || 1.886 || 2.920 || 4.303 || 6.965 || 9.925 | |||
|- | |||
| 3 || 0.765 || 1.638 || 2.353 || 3.182 || 4.541 || 5.841 | |||
|- | |||
| 4 || 0.741 || 1.533 || 2.132 || 2.776 || 3.747 || 4.604 | |||
|- | |||
| 5 || 0.727 || 1.476 || 2.015 || 2.571 || 3.365 || 4.032 | |||
|- | |||
| 6 || 0.718 || 1.440 || 1.943 || 2.447 || 3.143 || 3.707 | |||
|- | |||
| 7 || 0.711 || 1.415 || 1.895 || 2.365 || 2.998 || 3.499 | |||
|- | |||
| 8 || 0.706 || 1.397 || 1.860 || 2.306 || 2.896 || 3.355 | |||
|- | |||
| 9 || 0.703 || 1.383 || 1.833 || 2.262 || 2.821 || 3.250 | |||
|- | |||
| 10 || 0.700 || 1.372 || 1.812 || 2.228 || 2.764 || 3.169 | |||
|- | |||
| 11 || 0.697 || 1.363 || 1.796 || 2.201 || 2.718 || 3.106 | |||
|- | |||
| 12 || 0.695 || 1.356 || 1.782 || 2.179 || 2.681 || 3.055 | |||
|- | |||
| 13 || 0.694 || 1.350 || 1.771 || 2.160 || 2.650 || 3.012 | |||
|- | |||
| 14 || 0.692 || 1.345 || 1.761 || 2.145 || 2.624 || 2.977 | |||
|- | |||
| 15 || 0.691 || 1.341 || 1.753 || 2.131 || 2.602 || 2.947 | |||
|- | |||
| 16 || 0.690 || 1.337 || 1.746 || 2.120 || 2.583 || 2.921 | |||
|- | |||
| 17 || 0.689 || 1.333 || 1.740 || 2.110 || 2.567 || 2.898 | |||
|- | |||
| 18 || 0.688 || 1.330 || 1.734 || 2.101 || 2.552 || 2.878 | |||
|- | |||
| 19 || 0.688 || 1.328 || 1.729 || 2.093 || 2.539 || 2.861 | |||
|- | |||
| 20 || 0.687 || 1.325 || 1.725 || 2.086 || 2.528 || 2.845 | |||
|- | |||
| 21 || 0.686 || 1.323 || 1.721 || 2.080 || 2.518 || 2.831 | |||
|- | |||
| 22 || 0.686 || 1.321 || 1.717 || 2.074 || 2.508 || 2.819 | |||
|- | |||
| 23 || 0.685 || 1.319 || 1.714 || 2.069 || 2.500 || 2.807 | |||
|- | |||
| 24 || 0.685 || 1.318 || 1.711 || 2.064 || 2.492 || 2.797 | |||
|- | |||
| 25 || 0.684 || 1.316 || 1.708 || 2.060 || 2.485 || 2.787 | |||
|- | |||
| 26 || 0.684 || 1.315 || 1.706 || 2.056 || 2.479 || 2.779 | |||
|- | |||
| 27 || 0.684 || 1.314 || 1.703 || 2.052 || 2.473 || 2.771 | |||
|- | |||
| 28 || 0.683 || 1.313 || 1.701 || 2.048 || 2.467 || 2.763 | |||
|- | |||
| 29 || 0.683 || 1.311 || 1.699 || 2.045 || 2.462 || 2.756 | |||
|- | |||
| 30 || 0.683 || 1.310 || 1.697 || 2.042 || 2.457 || 2.750 | |||
|} | |||
{| class="wikitable" | |||
|+ Квантили <math>\chi^2(n)</math> расподеле (за <math>n > 30</math> се апроксимира нормалном) | |||
! | |||
! colspan="8" | <math>u</math> | |||
|- | |||
! <math>n</math> !! 0.005 !! 0.01 !! 0.025 !! 0.05 !! 0.95 !! 0.975 !! 0.99 !! 0.995 | |||
|- | |||
| 1 || 0.00004 || 0.00016 || 0.00098 || 0.00393 || 3.841 || 5.024 || 6.635 || 7.879 | |||
|- | |||
| 2 || 0.010 || 0.0201 || 0.0506 || 0.103 || 5.991 || 7.378 || 9.210 || 10.597 | |||
|- | |||
| 3 || 0.072 || 0.115 || 0.216 || 0.352 || 7.815 || 9.348 || 11.345 || 12.838 | |||
|- | |||
| 4 || 0.207 || 0.297 || 0.484 || 0.711 || 9.488 || 11.143 || 13.277 || 14.860 | |||
|- | |||
| 5 || 0.412 || 0.554 || 0.831 || 1.145 || 11.070 || 12.832 || 13.086 || 16.750 | |||
|- | |||
| 6 || 0.676 || 0.872 || 1.237 || 1.635 || 12.592 || 14.449 || 16.812 || 18.548 | |||
|- | |||
| 7 || 0.989 || 1.239 || 1.690 || 2.167 || 14.067 || 16.013 || 18.475 || 20.278 | |||
|- | |||
| 8 || 1.344 || 1.646 || 2.180 || 2.733 || 15.507 || 17.535 || 20.090 || 21.955 | |||
|- | |||
| 9 || 1.735 || 2.088 || 2.700 || 3.325 || 16.919 || 19.023 || 21.666 || 23.589 | |||
|- | |||
| 10 || 2.156 || 2.558 || 3.247 || 3.940 || 18.307 || 20.483 || 23.209 || 25.188 | |||
|- | |||
| 11 || 2.603 || 3.053 || 3.816 || 4.575 || 19.675 || 21.920 || 24.725 || 26.757 | |||
|- | |||
| 12 || 3.074 || 3.571 || 4.404 || 5.226 || 21.026 || 23.337 || 26.217 || 28.300 | |||
|- | |||
| 13 || 3.565 || 4.107 || 5.009 || 5.892 || 22.362 || 24.736 || 27.688 || 29.819 | |||
|- | |||
| 14 || 4.075 || 4.660 || 5.629 || 6.571 || 23.685 || 26.119 || 29.141 || 31.319 | |||
|- | |||
| 15 || 4.601 || 5.229 || 6.262 || 7.261 || 24.996 || 27.488 || 30.578 || 32.801 | |||
|- | |||
| 16 || 5.142 || 5.812 || 6.908 || 7.962 || 26.296 || 28.845 || 32.000 || 24.267 | |||
|- | |||
| 17 || 5.697 || 6.408 || 7.564 || 8.672 || 27.587 || 30.191 || 33.409 || 35.718 | |||
|- | |||
| 18 || 6.265 || 7.015 || 8.231 || 9.390 || 28.869 || 31.526 || 34.805 || 37.156 | |||
|- | |||
| 19 || 6.844 || 7.633 || 8.907 || 10.117 || 30.144 || 32.852 || 36.191 || 38.582 | |||
|- | |||
| 20 || 7.434 || 8.260 || 9.591 || 10.851 || 31.410 || 34.170 || 37.566 || 39.997 | |||
|- | |||
| 21 || 8.034 || 8.897 || 10.283 || 11.591 || 32.671 || 35.479 || 38.932 || 41.401 | |||
|- | |||
| 22 || 8.643 || 9.542 || 10.982 || 12.338 || 33.924 || 36.781 || 40.289 || 42.796 | |||
|- | |||
| 23 || 9.260 || 10.196 || 11.689 || 13.091 || 35.172 || 38.076 || 41.638 || 44.181 | |||
|- | |||
| 24 || 9.886 || 10.856 || 12.401 || 13.484 || 36.415 || 39.364 || 42.980 || 45.558 | |||
|- | |||
| 25 || 10.520 || 11.524 || 13.120 || 14.611 || 37.652 || 40.646 || 44.314 || 46.928 | |||
|- | |||
| 26 || 11.160 || 12.198 || 13.844 || 15.379 || 38.885 || 41.923 || 45.642 || 48.290 | |||
|- | |||
| 27 || 11.808 || 12.879 || 14.573 || 16.151 || 40.113 || 43.194 || 46.963 || 49.645 | |||
|- | |||
| 28 || 12.461 || 13.565 || 15.308 || 16.928 || 41.337 || 44.461 || 48.278 || 50.993 | |||
|- | |||
| 29 || 13.121 || 14.256 || 16.047 || 17.708 || 42.557 || 45.772 || 49.588 || 52.336 | |||
|- | |||
| 30 || 13.787 || 14.953 || 16.791 || 18.493 || 43.773 || 46.979 || 50.892 || 53.672 | |||
|} | |||
=== Тестирање параметарских хипотеза === | |||
* Ознаке: | |||
** <math>H_0</math>: нулта хипотеза | |||
*** <math>H_0: \theta \in \Theta_0</math> | |||
** <math>H_1</math>: алтернативна хипотеза | |||
*** <math>H_1: \theta \in \Theta_1</math> | |||
*** Увек важи да <math>\Theta_0 \cap \Theta_1 = \varnothing</math> | |||
*** Најчешће важи да <math>\Theta_0 \cup \Theta_1 = \Theta</math> | |||
** <math>S</math>: статистика теста | |||
** <math>C</math>: област одбацивања (критична област), хипотезу одбацујемо ако <math>S \in C</math>, иначе не одбацујемо | |||
** <math>\gamma(\theta)</math>: моћ теста, односно вероватноћа да ће <math>H_0</math> бити одбачена | |||
*** <math>\gamma(\theta) = P(S \in C)</math> | |||
** <math>\alpha(\theta)</math>: вероватноћа грешке првог реда, односно вероватноћа одбацивања <math>H_0</math> иако је тачна | |||
*** <math>\alpha(\theta) = \gamma(\theta)</math> за <math>\theta \in \Theta_0</math> | |||
** <math>\alpha = \sup_{\theta \in \Theta_0} \alpha(\theta)</math>: ниво значајности теста | |||
** <math>c</math>: критична вредност теста (граница области одбацивања) | |||
*** Пример: <math>C = [c, +\infty)</math>, <math>C = (-\infty, c]</math> | |||
* Померањем области одбацивања грешка једног реда расте а другог се смањује. | |||
** Уколико желимо да смањимо обе грешке треба да повећамо обим узорка. | |||
* Начини тестирања параметарских хипотеза (обрађени на вежбама): | |||
*# ... | |||
*# преко интервала поверења | |||
*# помоћу <math>p</math> вредности: <math>p = \sup P(S = s)</math> (или <math>S \leq s</math>, <math>S \geq s</math>) | |||
=== Тестирање непараметарских хипотеза === | |||
* Начини тестирања непараметарских хипотеза: | |||
** Поређењем хистограма: <math>\chi^2</math> тест | |||
** Поређењем функција расподеле: тест Колмогоров-Смирнова | |||
* Емипиријска функција расподеле: <math>F_n(x) = \begin{cases} | |||
0, & x < X_{(1)} \\ | |||
\frac{k}{n}, & X_{(k)} \leq x < X_{(k+1)} \\ | |||
1, & x \geq X_{(n)} | |||
\end{cases}</math> | |||
* '''Теорема 7.4''' (Гливенко-Кантели): Нека је <math>F_n</math> емпиријска функција расподеле добијена из независног узорка обима <math>n</math> из расподеле са функцијом расподеле <math>F</math>. Тада је <math>P(\lim_{n \to \infty} \sup_{x \in \mathbb{R}} \left|F_n(x) - F(x)\right| = 0) = 1</math> | |||
* '''Теорема 7.5:''' Нека је <math>F_n</math> емпиријска функција расподеле добијена из независног узорка обима <math>n</math> из расподеле са функцијом расподеле <math>F</math>. Тада је <math>\lim_{n \to \infty} P(\sqrt{n} \sup_{x \in \mathbb{R}} \left|F_n(x) - F(x)\right| \leq t) = K(t)</math>. | |||
** <math>K(t)</math> се назива Колмогоровом функцијом расподеле | |||
* '''Тест Колмогоров-Смирнова:'''ако је <math>F_0</math> функција расподеле непрекидне случајне променљиве и ми тестирамо <math>H_0: F = F_0</math>, онда важи да <math>\sqrt{n} \sup_{x \in \mathbb{R}} \left|F_n(x) - F(x)\right| > \varepsilon_{1 - \alpha} \implies</math> одбацујемо хипотезу (ако је квантил из <math>K(t)</math>). | |||
[[Категорија:Вероватноћа и статистика]] | [[Категорија:Вероватноћа и статистика]] | ||
[[Категорија:Водичи]] | [[Категорија:Водичи]] |
Тренутна верзија на датум 22. април 2024. у 22:47
Теорија са предавања може, поред задатака, доћи на колоквијумима. Испод је излистана сажета теорија, без додатних примера, ради вежбања за колоквијум.
Увод
Основни појмови
- Статистички експеримент:
- може да се понови више пута под истим условима
- познати су нам сви могући исходи (нотација: )
- не знамо унапред шта ће се десити у конкретном експерименту
- Скуп свих исхода (нотација: ) може бити коначан (бацање новчића), бесконачан, а уколико је бесконачан може бити пребројив (бацање коцке док не падне 6) и непребројив (бирање реалног броја из интервала)
- Догађај: подскуп (нотација: , , ...)
- Догађај се реализује у експерименту ако се оствари у једном од исхода који су његови елементи.
- Операције над догађајима:
- : A или B
- : A и B (нотација за пресек се не користи)
- : A, али не B
- , , : супротан догађај ()
Вероватноћа
- Аксиоме вероватноће: Вероватноћа је функција дефинисана над подскуповима неког скупа ако важи:
- , где су који су међусобно искључиви и којих има коначно или пребројиво бесконачно
- Статистичко одређивање вероватноће: изводимо експеримент пута и региструјемо догађај , тако да нам је број реализација догађаја :
- релативна фреквенција догађаја:
- Модел једнаковероватности исхода: ако су сви исходи из скупа једнаковероватни а број чланова је , онда се вероватноћа догађаја може одредити као количник броја повољних и свих исхода:
- Геометријска вероватноћа: за непребројив скуп који може да се представи геометријски као ограничени објекат (интервал праве, лик у равни, тело у простору) и догађај важи где је мера тог објекта (дужина, површина, запремина).
- Услов: једнаковероватни догађаји су представљени скуповима исте мере и обрнуто
Особине вероватноће
- Теорема 1.1:
- Доказ: како су и међусобно искључиви, важи , па из и трећег аксиома вероватноће добијамо .
- Теорема 1.2:
- Доказ: из и теореме 1.1 следи да је
- Теорема 1.3:
- Доказ:
- Ако су A и B међусобно искључиви, важи да је , па важи да је
- Ако нису, важи да је , па из трећег аксиома добијамо
- Доказ:
- Теорема 1.4:
- Доказ: , а пошто по другој аксиоми онда следи
- Теорема 1.5:
- Доказ:
- Ако су међусобно искључиви, тако да доказ следи по трећој аксиоми
- Ако нису, по трећој аксиоми и теореми 1.3
- Такође важи и
- Доказ:
Условна вероватноћа и независност догађаја
Условна вероватноћа
- Условна вероватноћа догађаја A под условом да се реализовао догађај B: за
- Теорема 2.1: Нека је и . Функција је вероватноћа.
- Доказ:
- За важи . Пошто је и , важи да је . Пошто је , из теореме 1.4 следи да је , односно
- Ако су међусобно искључиви догађаји којих има коначно или пребројиво много, добијамо . Пошто су скупови међусобно искључиви, на основу треће аксиоме следи
- Како су доказане све три аксиоме вероватноће, доказано је и да је условна вероватноћа, такође, вероватноћа.
- Доказ:
Независност догађаја
- Независност догађаја: Догађаји A и B су статистички независни ако важи .
- Независност по паровима: Ако су свака два од (за ) независна, онда су ти догађаји независни по паровима.
- Независност више догађаја у целини: Ако за сваки подскуп скупа догађаја , где је важи , онда су догађаји из тог скупа међусобно независни.
- Теорема 2.2: Ако су догађаји независни и ако је догађај добијен од догађаја () применом коначно много скуповних операција, онда су и догађаји такође независни.
- Доказ: није доказивано.
- Теорема 2.3: За догађаје () важи:
- Доказ: за је ово дефиниција условне вероватноће, за остатак се доказује индукцијом.
- Потпун скуп хипотеза: Ако су догађаји међусобно искључиви и важи онда они чине потпун скуп хипотеза.
- Тотална вероватноћа:
- Бајесова формула: За , важи
- Поузданост уређаја: вероватноћа да је уређај исправан, која зависи од поузданости његових компоненти. Две компоненте могу међусобно бити повезане редно или паралелно, и у зависности од тога одређујемо укупну поузданост те две компоненте.
- Редно:
- Паралелно:
Случајне променљиве
- Случајна променљива: пресликавање скупа свих исхода у скуп реалних бројева.
- Ознака: где је скуп свих бројева у које се пресликавају исходи.
- На основу пребројивости скупа случајне променљиве се деле на две категорије:
- Дискретне: уколико је овај скуп коначан или пребројив, и
- Непрекидне (мешовите): уколико је овај скуп непребројив.
- Расподела случајне променљиве: функција дефинисана над скуповима реалних бројева,
- Закон расподеле вероватноће случајне променљиве: за неку случајну променљиву , чији је скуп вредности , то је скуп вероватноћа где је за све
- Ознака: , тако да
Непрекидне случајне променљиве
- Функција расподеле: , за
- Особине функције расподеле:
- је монотоно неопадајућа функција
- је непрекидна са десне стране за свако
- има граничну вредност са леве стране у свакој тачки
- Функција густине расподеле: ако је ненегативна функција дефинисана на и важи , онда је непрекидна случајна променљива а њена функција густине расподеле.
- је непрекидна је непрекидна
- Ако има коначно или пребројиво много тачака прекида, у њима се може дефинисати произвољно.
- Теорема 3.1: За непрекидну случајну променљиву важи:
-
- Доказ:
-
- Доказ: ако интеграл представимо површином испод функције, није нам битно да ли избацимо нула, једну или две дужи из те површине.
- и
-
- Теорема 3.2: ако је дефинисана на , непрекидна са десне стране и ако је а , тада постоји случајна променљива којој је функција расподеле.
Расподеле
- Бернулијева: (Бернулијева расподела са вероватноћом успеха )
- Закон:
- Модел: индикатор догађаја,
- Биномна:
- Закон:
- Модел: Бернулијева шема је низ Бернулијевих (независних) експеримената, и у сваком експерименту догађај има вероватноћу , а наша случајна променљива јесте број реализација догађаја у изведених експеримената.
- Пуасонова:
- Закон:
- Модел: број ретких догађаја у јединици времена, тако да је просечан број догађаја
- Геометријска:
- Закон:
- Модел: изводе се Бернулијеви експерименти до првог успеха, а наша случајна променљива је број неуспеха
- Паскалова (обрнута биномна):
- Закон:
- Модел: број Бернулијевих експеримената до -тог успеха.
- Хипергеометријска:
- Модел: на располагању је предмета од којих је једне а друге врсте, од њих бирамо предмета () и случајна променљива нам је број предмета прве врсте међу изабраним
- Закон:
- (Дискретна) униформна:
- Закон: , за
- (Непрекидна) униформна:
- Закон: ( је концентрисана на )
- Модел: бирамо број из , а случајна променљива нам је да ли је број у (где је )
- Закон: ( је концентрисана на )
- Експоненцијална:
- Модел: време између Пуасонових догађаја, где је реципрочно просечно време
- Закон:
- Особина одсуства меморије:
- Стандардна нормална (стандардна Гаусова):
- Закон:
- (неизрачунљиво, али се рачуна на основу таблице, с тим што и )
- Закон:
X | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 |
---|---|---|---|---|---|---|---|---|---|---|
0.0 | 5000 | 5040 | 5080 | 5120 | 5160 | 5199 | 5239 | 5279 | 5319 | 5359 |
0.1 | 5398 | 5438 | 5478 | 5517 | 5557 | 5596 | 5636 | 5675 | 5714 | 5753 |
0.2 | 5793 | 5832 | 5871 | 5910 | 5948 | 5987 | 6026 | 6064 | 6103 | 6141 |
0.3 | 6179 | 6217 | 6255 | 6293 | 6331 | 6368 | 6406 | 6443 | 6480 | 6517 |
0.4 | 6554 | 6591 | 6628 | 6664 | 6700 | 6736 | 6772 | 6808 | 6844 | 6879 |
0.5 | 6915 | 6950 | 6985 | 7019 | 7054 | 7088 | 7123 | 7157 | 7190 | 7224 |
0.6 | 7257 | 7291 | 7324 | 7357 | 7389 | 7422 | 7454 | 7486 | 7517 | 7549 |
0.7 | 7580 | 7611 | 7642 | 7673 | 7704 | 7734 | 7764 | 7794 | 7823 | 7852 |
0.8 | 7881 | 7910 | 7939 | 7967 | 7995 | 8023 | 8051 | 8078 | 8106 | 8133 |
0.9 | 8159 | 8186 | 8212 | 8238 | 8264 | 8289 | 8315 | 8340 | 8365 | 8389 |
1.0 | 8413 | 8438 | 8461 | 8485 | 8508 | 8531 | 8554 | 8577 | 8599 | 8621 |
1.1 | 8643 | 8665 | 8686 | 8708 | 8729 | 8749 | 8770 | 8790 | 8810 | 8830 |
1.2 | 8849 | 8869 | 8888 | 8907 | 8925 | 8944 | 8962 | 8980 | 8997 | 9015 |
1.3 | 9032 | 9049 | 9066 | 9082 | 9099 | 9115 | 9131 | 9147 | 9162 | 9177 |
1.4 | 9192 | 9207 | 9222 | 9236 | 9251 | 9265 | 9279 | 9292 | 9306 | 9319 |
1.5 | 9332 | 9345 | 9357 | 9370 | 9382 | 9394 | 9406 | 9418 | 9429 | 9441 |
1.6 | 9452 | 9463 | 9474 | 9484 | 9495 | 9505 | 9515 | 9525 | 9535 | 9545 |
1.7 | 9554 | 9564 | 9573 | 9582 | 9591 | 9599 | 9608 | 9616 | 9625 | 9633 |
1.8 | 9641 | 9649 | 9656 | 9664 | 9671 | 9678 | 9686 | 9693 | 9699 | 9706 |
1.9 | 9713 | 9719 | 9726 | 9732 | 9738 | 9744 | 9790 | 9756 | 9761 | 9767 |
2.0 | 97725 | 97778 | 97831 | 97882 | 97932 | 97982 | 98030 | 98077 | 98124 | 98169 |
2.1 | 98214 | 98257 | 98300 | 98341 | 98382 | 98422 | 98461 | 98500 | 98537 | 98574 |
2.2 | 98610 | 98645 | 98679 | 98713 | 98745 | 98778 | 98809 | 98840 | 98870 | 98899 |
2.3 | 98928 | 98956 | 98983 | 99010 | 99036 | 99061 | 99086 | 99111 | 99134 | 99158 |
2.4 | 99180 | 99202 | 99224 | 99245 | 99266 | 99286 | 99305 | 99324 | 99343 | 99361 |
2.5 | 99379 | 99396 | 99413 | 99430 | 99446 | 99461 | 99477 | 99492 | 99506 | 99520 |
2.6 | 99534 | 99547 | 99560 | 99573 | 99585 | 99598 | 99609 | 99621 | 99632 | 99643 |
2.7 | 99653 | 99664 | 99674 | 99683 | 99693 | 99702 | 99711 | 99720 | 99728 | 99736 |
2.8 | 99744 | 99752 | 99760 | 99767 | 99774 | 99781 | 99788 | 99795 | 99801 | 99807 |
2.9 | 99813 | 99819 | 99825 | 99831 | 99836 | 99841 | 99846 | 99851 | 99856 | 99861 |
3.0 | 998650 | 998694 | 998736 | 998777 | 998817 | 998856 | 998893 | 998930 | 998965 | 998999 |
3.1 | 999032 | 999065 | 999096 | 999126 | 999155 | 999184 | 999211 | 999238 | 999264 | 999289 |
3.2 | 999313 | 999336 | 999359 | 999381 | 999402 | 999423 | 999443 | 999462 | 999481 | 999499 |
3.3 | 999517 | 999534 | 999550 | 999566 | 999581 | 999596 | 999610 | 999624 | 999638 | 999651 |
3.4 | 999663 | 999675 | 999687 | 999698 | 999709 | 999720 | 999730 | 999740 | 999749 | 999758 |
Случајни вектори
- Случајни вектор: скуп случајних променљивих дефинисаних на истом скупу исхода
- Заједнички закон расподеле: одређен је ако су познате све вероватноће за све вредности и које случајне променљиве узимају
- Маргинални закони расподеле: појединачни закони расподеле случајних променљивих у вектору, добијени из заједничког закона као
- Заједничка функција расподеле: за све
- Заједничка функција густине: Ако постоји ненегативна функција дефинисана за таква да онда је непрекидан случајни вектор а његова заједничка густина. Њене особине су:
- Маргиналне функције густине:
Независност случајних променљивих
- су независне ако су догађаји независни за све могуће
- Услови независности:
- Ако у свакој тачки важи где је заједничка функција расподеле а су маргиналне функције расподеле.
- Ако су и дискретне и важи за све вредности и .
- Ако су и непрекидне и важи где је заједничка функција густине а су маргиналне функције густине.
Варијациони низ
- Ако су независне случајне променљиве са истом расподелом које означавају вредности добијене у неким догађајима (на пример, резултати бацања коцкице), онда променљиве које носе вредност најмање од ових променљивих, друге најмање од ових променљивих, ... редом чине варијациони низ.
- Променљиве варијационог низа немају исту расподелу као оригиналне случајне променљиве, и више нису независне.
- Функција расподеле -те случајне променљиве варијационог низа:
- Специјални случајеви:
- Функција расподеле најмање случајне променљиве варијационог низа:
- Функција расподеле највеће случајне променљиве варијационог низа:
Нумеричке карактеристике случајних променљивих
Математичко очекивање
- За дискретну случајну променљиву са коначним скупом вредности , математичко очекивање је дефинисано са
- За дискретну случајну променљиву са бесконачним скупом вредности, математичко очекивање је дефинисано са (под условом да овај ред апсолутно конвергира)
- За непрекидну случајну променљиву са густином , математичко очекивање је дефинисано са (под условом да овај интеграл апсолутно конвергира)
- Теорема 4.1: Нека је непрекидна случајна променљива са густином и функција за коју постоји . Тада је: .
- Теорема 4.2: Нека су и случајне променљиве са очекивањима и , а . Тада важи:
- Ако су и независне, онда је
Варијанса
- Варијанса (дисперзија): за променљиву са очекивањем , варијанса је
- Стандардна девијација (стандардно одступање):
- Особине варијансе за :
-
- Доказ:
- за неко
- Доказ: није доказивано.
-
- Доказ:
- Ако су и независне са коначним варијансама, онда је
-
- Коваријанса: (одступање од очекиване вредности обе променљиве)
- Теорема 4.3:
- Доказ:
- Теорема 4.4:
- Доказ:
- Теорема 4.3:
- Особине коваријансе за променљиве и :
- Ако су и независне, .
- Коефицијент корелације: (за )
- Теорема 4.5:
-
- Доказ: уочимо случајну променљиву . . Како је , онда важи . Аналогно томе, уколико уочимо случајну променљиву са - уместо + добијамо .
- ако и само ако , где је
- за , где се узима знак плус ако је позитивно, а минус у супротном
-
- Корелација:
- променљиве су некорелисане
- променљиве су позитивно корелисане
- променљиве су негативно корелисане
- Моменти:
- : моменат реда
- : апсолутни моменат реда
- : централни моменат реда
- Квантили: за дату случајну променљиву са расподелом , квантил реда је сваки број за који важи .
- За сваку расподелу и за свако постоји бар један квантил тог реда.
- Ознака:
- : медијана (мера средње вредности)
- : први квартил
- : други квартил
- Теорема 4.5:
Нумеричке карактеристике расподела
Расподела | Математичко очекивање | Варијанса |
---|---|---|
Карактеристичне функције
- Дефинише се као .
- За дискретно : за све вредности
- За непрекидно : , где означава густину
- Теорема 5.1:
- За сваку случајну променљиву постоји одговарајућа карактеристична функција
- Различитим карактеристичним функцијама одговарају различите расподеле и обрнуто
- За сваку случајну променљиву и свака два реална или комплексна броја важи
- Ако случајна променљива има момент реда тада важи
- За две независне случајне променљиве важи
- Доказ:
Граничне теореме
- Низ случајних променљивих :
- строго конвергира (конвергира скоро свуда) ка ако
- конвергира у вероватноћи ка ако је за свако
- конвергира у расподели (слабо конвергира) ка ако у свакој тачки у којој је непрекидна
- -конвергира ка за ако
- За се каже да конвергира у средњем квадратном ка
- Из строге конвергенције следи конвергенција у вероватноћи, из конвергенције у вероватноћи следи конвергенција у расподели, а из конвергенције такође следи конвергенција у вероватноћи.
- Теорема 6.1: (теорема о непрекидности) Нека је низ случајних променљивих са карактеристичним функцијама и нека је случајна променљива са карактеристичном функцијом . Низ конвергира у расподели ка ако и само ако је за свако .
- Теорема 6.2: (апроксимација биномне расподеле Пуасоновом) ако и ако онда
- Теорема 6.3: (неједнакост Маркова) ако је ненегативна случајна променљива и постоји , онда за свако
- Теорема 6.4: (неједнакост Чебишева) ако постоји , тада је за свако
- Доказ: на основу неједнакости Маркова,
- Теорема 6.5: (слаби закон великих бројева) Нека су независне случајне променљиве са истим очекивањем и са коначним варијансама за свако , где је позитивна константа. Тада низ аритметичких средина конвергира у вероватноћи ка .
- Теорема 6.6: (Борелов строги закон великих бројева) Ако је број успеха у Бернулијевих експеримената са вероватноћом успеха . тада је
- Теорема 6.7: (Коломогоровљев строги закон великих бројева)
- Ако су независне случајне променљиве са истом расподелом и очекивањем , тада важи
- Ако су независне случајне променљиве са истом расподелом и ако постоји такав да је , тада све променљиве имају очекивање
- Теорема 6.8: (централна гранична теорема) Ако су независне, са истом расподелом, очекивањем и коначним варијансама , тада конвергира у расподели ка .
- У пракси мора да важи .
- Теорема 6.9: (апроксимација биномне расподеле нормалном, Моавр-Лапласова теорема) Ако је и тада конвергира у расподели ка
- Доказ: следи из централне граничне теореме,
- Апроксимација Пуасонове расподеле нормалном:
Статистика
Основни појмови
- Популација: скуп елемената (паралела из вероватноће: скуп исхода)
- Обележје: нумеричка особина елемената (паралела из вероватноће: случајна променљива)
- Статистички експеримент (у пракси): регистровање вредности на неком (правом) подскупу скупа , који називамо узорак. На основу узорка доносимо закључке о расподели .
- Случајни узорак димензије је скуп независних случајних променљивих са истом расподелом.
- Реализовани узорак представља реализоване вредности случајних променљивих у посматраном експерименту.
- Статистика је случајна променљива која зависи само од случајних променљивих из узорка, не и од непознатих параметара расподеле.
- Њена расподела сме да зависи од ових параметара.
- Реализована вредност статистике:
Оцене параметара
- Обележје има расподелу која зависи од скупа параметара .
- : скуп допустивих расподела
- : фамилија расподела
- Ако не знамо можемо да бирамо узорак и на основу њега оцењујемо .
Тачкаста оцена
- Реализована вредност статистике
- Карактеристике:
- је центрирана (непристрасна) ако је за свако .
- је асимптотски непристрасна ако .
- је стабилна (постојана) ако конвергира у вероватноћи ка .
- Ако су и две оцене истог параметра , је боља од ако је с тим што строга неједнакост важи за бар једно .
- Ако су и две центриране оцене истог параметра , кажемо да је ефикасније од ако је с тим што строга неједнакост важи за бар једно .
Интервална оцена
- Интервал поверења: је интервал који, за дат узорак обима из расподеле , садржи непознати параметар са вероватноћом .
- Двострани интервал поверења:
- Једнострани интервал поверења: или
- и су статистике.
- Студентова -расподела:
- Гама функција:
- За можемо апроксимирати са
- Теорема 7.1: Ако су са непознатим и , нека је и , тада важи .
- Хи квадрат расподела:
- Теорема 7.2: Ако су , њихов збир има расподелу .
- Теорема 7.3: Ако су са непознатим :
- Ако је познато:
- Ако је непознато:
Процена | Двострани интервал | Једнострани интервал | |
---|---|---|---|
Процена непознатог | Познато | или | |
Непознато | Процењујемо : , | ||
или | |||
Процена непознатог | Познато | , квантили из | или , квантили из |
Непознато | , квантили из | или , квантили из |
- Ако расподела није , за важи централна гранична теорема, тако да можемо апроксимирати интервал поверења као за нормалну расподелу.
0.75 | 0.90 | 0.95 | 0.975 | 0.99 | 0.995 | |
---|---|---|---|---|---|---|
1 | 1.000 | 3.078 | 6.314 | 12.706 | 31.821 | 63.657 |
2 | 0.816 | 1.886 | 2.920 | 4.303 | 6.965 | 9.925 |
3 | 0.765 | 1.638 | 2.353 | 3.182 | 4.541 | 5.841 |
4 | 0.741 | 1.533 | 2.132 | 2.776 | 3.747 | 4.604 |
5 | 0.727 | 1.476 | 2.015 | 2.571 | 3.365 | 4.032 |
6 | 0.718 | 1.440 | 1.943 | 2.447 | 3.143 | 3.707 |
7 | 0.711 | 1.415 | 1.895 | 2.365 | 2.998 | 3.499 |
8 | 0.706 | 1.397 | 1.860 | 2.306 | 2.896 | 3.355 |
9 | 0.703 | 1.383 | 1.833 | 2.262 | 2.821 | 3.250 |
10 | 0.700 | 1.372 | 1.812 | 2.228 | 2.764 | 3.169 |
11 | 0.697 | 1.363 | 1.796 | 2.201 | 2.718 | 3.106 |
12 | 0.695 | 1.356 | 1.782 | 2.179 | 2.681 | 3.055 |
13 | 0.694 | 1.350 | 1.771 | 2.160 | 2.650 | 3.012 |
14 | 0.692 | 1.345 | 1.761 | 2.145 | 2.624 | 2.977 |
15 | 0.691 | 1.341 | 1.753 | 2.131 | 2.602 | 2.947 |
16 | 0.690 | 1.337 | 1.746 | 2.120 | 2.583 | 2.921 |
17 | 0.689 | 1.333 | 1.740 | 2.110 | 2.567 | 2.898 |
18 | 0.688 | 1.330 | 1.734 | 2.101 | 2.552 | 2.878 |
19 | 0.688 | 1.328 | 1.729 | 2.093 | 2.539 | 2.861 |
20 | 0.687 | 1.325 | 1.725 | 2.086 | 2.528 | 2.845 |
21 | 0.686 | 1.323 | 1.721 | 2.080 | 2.518 | 2.831 |
22 | 0.686 | 1.321 | 1.717 | 2.074 | 2.508 | 2.819 |
23 | 0.685 | 1.319 | 1.714 | 2.069 | 2.500 | 2.807 |
24 | 0.685 | 1.318 | 1.711 | 2.064 | 2.492 | 2.797 |
25 | 0.684 | 1.316 | 1.708 | 2.060 | 2.485 | 2.787 |
26 | 0.684 | 1.315 | 1.706 | 2.056 | 2.479 | 2.779 |
27 | 0.684 | 1.314 | 1.703 | 2.052 | 2.473 | 2.771 |
28 | 0.683 | 1.313 | 1.701 | 2.048 | 2.467 | 2.763 |
29 | 0.683 | 1.311 | 1.699 | 2.045 | 2.462 | 2.756 |
30 | 0.683 | 1.310 | 1.697 | 2.042 | 2.457 | 2.750 |
0.005 | 0.01 | 0.025 | 0.05 | 0.95 | 0.975 | 0.99 | 0.995 | |
---|---|---|---|---|---|---|---|---|
1 | 0.00004 | 0.00016 | 0.00098 | 0.00393 | 3.841 | 5.024 | 6.635 | 7.879 |
2 | 0.010 | 0.0201 | 0.0506 | 0.103 | 5.991 | 7.378 | 9.210 | 10.597 |
3 | 0.072 | 0.115 | 0.216 | 0.352 | 7.815 | 9.348 | 11.345 | 12.838 |
4 | 0.207 | 0.297 | 0.484 | 0.711 | 9.488 | 11.143 | 13.277 | 14.860 |
5 | 0.412 | 0.554 | 0.831 | 1.145 | 11.070 | 12.832 | 13.086 | 16.750 |
6 | 0.676 | 0.872 | 1.237 | 1.635 | 12.592 | 14.449 | 16.812 | 18.548 |
7 | 0.989 | 1.239 | 1.690 | 2.167 | 14.067 | 16.013 | 18.475 | 20.278 |
8 | 1.344 | 1.646 | 2.180 | 2.733 | 15.507 | 17.535 | 20.090 | 21.955 |
9 | 1.735 | 2.088 | 2.700 | 3.325 | 16.919 | 19.023 | 21.666 | 23.589 |
10 | 2.156 | 2.558 | 3.247 | 3.940 | 18.307 | 20.483 | 23.209 | 25.188 |
11 | 2.603 | 3.053 | 3.816 | 4.575 | 19.675 | 21.920 | 24.725 | 26.757 |
12 | 3.074 | 3.571 | 4.404 | 5.226 | 21.026 | 23.337 | 26.217 | 28.300 |
13 | 3.565 | 4.107 | 5.009 | 5.892 | 22.362 | 24.736 | 27.688 | 29.819 |
14 | 4.075 | 4.660 | 5.629 | 6.571 | 23.685 | 26.119 | 29.141 | 31.319 |
15 | 4.601 | 5.229 | 6.262 | 7.261 | 24.996 | 27.488 | 30.578 | 32.801 |
16 | 5.142 | 5.812 | 6.908 | 7.962 | 26.296 | 28.845 | 32.000 | 24.267 |
17 | 5.697 | 6.408 | 7.564 | 8.672 | 27.587 | 30.191 | 33.409 | 35.718 |
18 | 6.265 | 7.015 | 8.231 | 9.390 | 28.869 | 31.526 | 34.805 | 37.156 |
19 | 6.844 | 7.633 | 8.907 | 10.117 | 30.144 | 32.852 | 36.191 | 38.582 |
20 | 7.434 | 8.260 | 9.591 | 10.851 | 31.410 | 34.170 | 37.566 | 39.997 |
21 | 8.034 | 8.897 | 10.283 | 11.591 | 32.671 | 35.479 | 38.932 | 41.401 |
22 | 8.643 | 9.542 | 10.982 | 12.338 | 33.924 | 36.781 | 40.289 | 42.796 |
23 | 9.260 | 10.196 | 11.689 | 13.091 | 35.172 | 38.076 | 41.638 | 44.181 |
24 | 9.886 | 10.856 | 12.401 | 13.484 | 36.415 | 39.364 | 42.980 | 45.558 |
25 | 10.520 | 11.524 | 13.120 | 14.611 | 37.652 | 40.646 | 44.314 | 46.928 |
26 | 11.160 | 12.198 | 13.844 | 15.379 | 38.885 | 41.923 | 45.642 | 48.290 |
27 | 11.808 | 12.879 | 14.573 | 16.151 | 40.113 | 43.194 | 46.963 | 49.645 |
28 | 12.461 | 13.565 | 15.308 | 16.928 | 41.337 | 44.461 | 48.278 | 50.993 |
29 | 13.121 | 14.256 | 16.047 | 17.708 | 42.557 | 45.772 | 49.588 | 52.336 |
30 | 13.787 | 14.953 | 16.791 | 18.493 | 43.773 | 46.979 | 50.892 | 53.672 |
Тестирање параметарских хипотеза
- Ознаке:
- : нулта хипотеза
- : алтернативна хипотеза
- Увек важи да
- Најчешће важи да
- : статистика теста
- : област одбацивања (критична област), хипотезу одбацујемо ако , иначе не одбацујемо
- : моћ теста, односно вероватноћа да ће бити одбачена
- : вероватноћа грешке првог реда, односно вероватноћа одбацивања иако је тачна
- за
- : ниво значајности теста
- : критична вредност теста (граница области одбацивања)
- Пример: ,
- : нулта хипотеза
- Померањем области одбацивања грешка једног реда расте а другог се смањује.
- Уколико желимо да смањимо обе грешке треба да повећамо обим узорка.
- Начини тестирања параметарских хипотеза (обрађени на вежбама):
- ...
- преко интервала поверења
- помоћу вредности: (или , )
Тестирање непараметарских хипотеза
- Начини тестирања непараметарских хипотеза:
- Поређењем хистограма: тест
- Поређењем функција расподеле: тест Колмогоров-Смирнова
- Емипиријска функција расподеле:
- Теорема 7.4 (Гливенко-Кантели): Нека је емпиријска функција расподеле добијена из независног узорка обима из расподеле са функцијом расподеле . Тада је
- Теорема 7.5: Нека је емпиријска функција расподеле добијена из независног узорка обима из расподеле са функцијом расподеле . Тада је .
- се назива Колмогоровом функцијом расподеле
- Тест Колмогоров-Смирнова:ако је функција расподеле непрекидне случајне променљиве и ми тестирамо , онда важи да одбацујемо хипотезу (ако је квантил из ).