Вероватноћа и статистика/Теорија — разлика између измена

Извор: SI Wiki
Пређи на навигацију Пређи на претрагу
м (+P4)
м (→‎Варијанса: Kod osobina kovarijanse, promenljive X, Y i Z ne moraju biti nezavisne)
 
(Није приказано 18 међуизмена 3 корисника)
Ред 145: Ред 145:
#* Модел: време између Пуасонових догађаја, где је <math>\lambda</math> реципрочно просечно време
#* Модел: време између Пуасонових догађаја, где је <math>\lambda</math> реципрочно просечно време
#* Закон: <math>f(x) = \left\{\begin{matrix}
#* Закон: <math>f(x) = \left\{\begin{matrix}
   \lambda e^{-ix}, & x \geq 0 \\
   \lambda e^{-\lambda x}, & x \geq 0 \\
   0, & x < 0
   0, & x < 0
\end{matrix}\right.</math>
\end{matrix}\right.</math>
#** <math>F(x) = \left\{\begin{matrix}
#** <math>F(x) = \left\{\begin{matrix}
   0, & x < 0 \\
   0, & x < 0 \\
   1 - e^{-ix}, & x \geq 0
   1 - e^{-\lambda x}, & x \geq 0
\end{matrix}\right.</math>
\end{matrix}\right.</math>
#* Особина одсуства меморије: <math>P(X > s + t | X > s) = P(X > t), s, t > 0</math>  
#* Особина одсуства меморије: <math>P(X > s + t | X > s) = P(X > t), s, t > 0</math>  
# '''Стандардна нормална (стандардна Гаусова):''' <math>Z \sim \mathcal{N}(0, 1)</math>
#* Закон: <math>f(x) = \frac{1}{\sqrt{2\pi}} e^{-\frac{x^2}{2}}</math>
#** <math>\Phi(x) = \int_{-\infty}^x = \frac{1}{\sqrt{2\pi}} e^{-\frac{x^2}{2}} dx</math> ('''неизрачунљиво''', али се рачуна на основу таблице, с тим што <math>x \geq 3.5 \implies \Phi(x) \approx 1</math> и <math>x < 0 \implies \Phi(-x) + \Phi(x) = 1</math>)
{| class="wikitable"
|+ Вредности <math>\Phi(x)</math> (пример: <math>\Phi(1.43) = 0.9236</math>)
! X  !! 0      !! 1      !! 2      !! 3      !! 4      !! 5      !! 6      !! 7      !! 8      !! 9
|-
| 0.0 || 5000  || 5040  || 5080  || 5120  || 5160  || 5199  || 5239  || 5279  || 5319  || 5359
|-
| 0.1 || 5398  || 5438  || 5478  || 5517  || 5557  || 5596  || 5636  || 5675  || 5714  || 5753
|-
| 0.2 || 5793  || 5832  || 5871  || 5910  || 5948  || 5987  || 6026  || 6064  || 6103  || 6141
|-
| 0.3 || 6179  || 6217  || 6255  || 6293  || 6331  || 6368  || 6406  || 6443  || 6480  || 6517
|-
| 0.4 || 6554  || 6591  || 6628  || 6664  || 6700  || 6736  || 6772  || 6808  || 6844  || 6879
|-
| 0.5 || 6915  || 6950  || 6985  || 7019  || 7054  || 7088  || 7123  || 7157  || 7190  || 7224
|-
| 0.6 || 7257  || 7291  || 7324  || 7357  || 7389  || 7422  || 7454  || 7486  || 7517  || 7549
|-
| 0.7 || 7580  || 7611  || 7642  || 7673  || 7704  || 7734  || 7764  || 7794  || 7823  || 7852
|-
| 0.8 || 7881  || 7910  || 7939  || 7967  || 7995  || 8023  || 8051  || 8078  || 8106  || 8133
|-
| 0.9 || 8159  || 8186  || 8212  || 8238  || 8264  || 8289  || 8315  || 8340  || 8365  || 8389
|-
| 1.0 || 8413  || 8438  || 8461  || 8485  || 8508  || 8531  || 8554  || 8577  || 8599  || 8621
|-
| 1.1 || 8643  || 8665  || 8686  || 8708  || 8729  || 8749  || 8770  || 8790  || 8810  || 8830
|-
| 1.2 || 8849  || 8869  || 8888  || 8907  || 8925  || 8944  || 8962  || 8980  || 8997  || 9015
|-
| 1.3 || 9032  || 9049  || 9066  || 9082  || 9099  || 9115  || 9131  || 9147  || 9162  || 9177
|-
| 1.4 || 9192  || 9207  || 9222  || 9236  || 9251  || 9265  || 9279  || 9292  || 9306  || 9319
|-
| 1.5 || 9332  || 9345  || 9357  || 9370  || 9382  || 9394  || 9406  || 9418  || 9429  || 9441
|-
| 1.6 || 9452  || 9463  || 9474  || 9484  || 9495  || 9505  || 9515  || 9525  || 9535  || 9545
|-
| 1.7 || 9554  || 9564  || 9573  || 9582  || 9591  || 9599  || 9608  || 9616  || 9625  || 9633
|-
| 1.8 || 9641  || 9649  || 9656  || 9664  || 9671  || 9678  || 9686  || 9693  || 9699  || 9706
|-
| 1.9 || 9713  || 9719  || 9726  || 9732  || 9738  || 9744  || 9790  || 9756  || 9761  || 9767
|-
| 2.0 || 97725  || 97778  || 97831  || 97882  || 97932  || 97982  || 98030  || 98077  || 98124  || 98169
|-
| 2.1 || 98214  || 98257  || 98300  || 98341  || 98382  || 98422  || 98461  || 98500  || 98537  || 98574
|-
| 2.2 || 98610  || 98645  || 98679  || 98713  || 98745  || 98778  || 98809  || 98840  || 98870  || 98899
|-
| 2.3 || 98928  || 98956  || 98983  || 99010  || 99036  || 99061  || 99086  || 99111  || 99134  || 99158
|-
| 2.4 || 99180  || 99202  || 99224  || 99245  || 99266  || 99286  || 99305  || 99324  || 99343  || 99361
|-
| 2.5 || 99379  || 99396  || 99413  || 99430  || 99446  || 99461  || 99477  || 99492  || 99506  || 99520
|-
| 2.6 || 99534  || 99547  || 99560  || 99573  || 99585  || 99598  || 99609  || 99621  || 99632  || 99643
|-
| 2.7 || 99653  || 99664  || 99674  || 99683  || 99693  || 99702  || 99711  || 99720  || 99728  || 99736
|-
| 2.8 || 99744  || 99752  || 99760  || 99767  || 99774  || 99781  || 99788  || 99795  || 99801  || 99807
|-
| 2.9 || 99813  || 99819  || 99825  || 99831  || 99836  || 99841  || 99846  || 99851  || 99856  || 99861
|-
| 3.0 || 998650 || 998694 || 998736 || 998777 || 998817 || 998856 || 998893 || 998930 || 998965 || 998999
|-
| 3.1 || 999032 || 999065 || 999096 || 999126 || 999155 || 999184 || 999211 || 999238 || 999264 || 999289
|-
| 3.2 || 999313 || 999336 || 999359 || 999381 || 999402 || 999423 || 999443 || 999462 || 999481 || 999499
|-
| 3.3 || 999517 || 999534 || 999550 || 999566 || 999581 || 999596 || 999610 || 999624 || 999638 || 999651
|-
| 3.4 || 999663 || 999675 || 999687 || 999698 || 999709 || 999720 || 999730 || 999740 || 999749 || 999758
|}


=== Случајни вектори ===
=== Случајни вектори ===
Ред 158: Ред 235:
* '''Заједнички закон расподеле:''' одређен је ако су познате све вероватноће <math>p_{ij} = P(X = x_i, Y = y_j)</math> за све вредности <math>x_i</math> и <math>y_j</math> које случајне променљиве узимају
* '''Заједнички закон расподеле:''' одређен је ако су познате све вероватноће <math>p_{ij} = P(X = x_i, Y = y_j)</math> за све вредности <math>x_i</math> и <math>y_j</math> које случајне променљиве узимају
* '''Маргинални закони расподеле:''' појединачни закони расподеле случајних променљивих у вектору, добијени из заједничког закона као <math>P(X = x_i) = p_{i1} + p_{i2} + ...</math>
* '''Маргинални закони расподеле:''' појединачни закони расподеле случајних променљивих у вектору, добијени из заједничког закона као <math>P(X = x_i) = p_{i1} + p_{i2} + ...</math>
* '''Независност дискретних случајних променљивих:''' <math>X</math> и <math>Y</math> су независне ако важи <math>P(X = x_i, Y = y_i) = P(X = x_i) P(Y = y_1)</math> за све вредности <math>x_i</math> и <math>y_j</math>.
* '''Заједничка функција расподеле:''' <math>F(x, y) = P(X \leq x, Y \leq y)</math> за све <math>x, y \in \mathbb{R}</math>
* '''Заједничка функција густине:''' Ако постоји ненегативна функција <math>f(x, y)</math> дефинисана за <math>X, Y \in \mathbb{R}</math> таква да <math>(\forall (x, y) \in \mathbb{R}^2) F(x, y) = \int_{-\infty}^x \int_{-\infty}^y f(x, y) dx dy</math> онда је <math>(X, Y)</math> непрекидан случајни вектор а <math>f(x, y)</math> његова заједничка густина. Њене особине су:
*# <math>\int_{-\infty}^{+\infty} \int_{-\infty}^{+\infty} f(x, y) = 1</math>
*# <math>f(x, y) = \frac{\partial^2 F(x, y)}{\partial x \partial y}</math>
*# <math>P((X, Y) \in D) = \int_D \int_D f(x, y) dx dy</math>
* '''Маргиналне функције густине:''' <math>f_X(x) = \int_{-\infty}^{+\infty} f(x, y) dy</math>
 
=== Независност случајних променљивих ===
* <math>X_1, X_2, ..., X_n</math> су независне ако су догађаји <math>X_1 \in A_1, X_2 \in A_2, ...X_n \in A_n</math> независни за све могуће <math>A_1, A_2, ..., A_n \subset \mathbb{R}</math>
* '''Услови независности:'''
*# Ако у свакој тачки <math>(x, y) \in \mathbb{R}^2</math> важи <math>F(x, y) = F_X(x) F_Y(y)</math> где је <math>F</math> заједничка функција расподеле а <math>F_X, F_Y</math> су маргиналне функције расподеле.
*# Ако су <math>X</math> и <math>Y</math> дискретне и важи <math>P(X = x_i, Y = y_i) = P(X = x_i) P(Y = y_1)</math> за све вредности <math>x_i</math> и <math>y_j</math>.
*# Ако су <math>X</math> и <math>Y</math> непрекидне и важи <math>(\forall (x, y) \in \mathbb{R}^2) f(x, y) = f_X(x) f_Y(y)</math> где је <math>f</math> заједничка функција густине а <math>f_X, f_Y</math> су маргиналне функције густине.
 
=== Варијациони низ ===
* Ако су <math>X_1, X_2, ... X_n</math> независне случајне променљиве са истом расподелом које означавају вредности добијене у неким догађајима (на пример, резултати бацања коцкице), онда променљиве <math>X_{(1)}, X_{(2)}, ... X_{(n)}</math> које носе вредност најмање од ових променљивих, друге најмање од ових променљивих, ... редом чине варијациони низ.
** Променљиве варијационог низа немају исту расподелу као оригиналне случајне променљиве, и више нису независне.
* '''Функција расподеле <math>k</math>-те случајне променљиве варијационог низа:''' <math>F_k(x) = \sum_{j = k}^n \binom{n}{j} F(x)^j (1 - F(x))^{n - j}</math>
* Специјални случајеви:
** Функција расподеле најмање случајне променљиве варијационог низа: <math>F_{min}(x) = 1 - (1 - F(x))^n</math>
** Функција расподеле највеће случајне променљиве варијационог низа: <math>F_{max}(x) = F(x)^n</math>
 
== Нумеричке карактеристике случајних променљивих ==
=== Математичко очекивање ===
* За дискретну случајну променљиву <math>X</math> са коначним скупом вредности <math>\{x_1, x_2, ..., x_n\}</math>, математичко очекивање је дефинисано са <math>EX = \sum_{k = 1}^n x_k P(X = x_k)</math>
* За дискретну случајну променљиву <math>X</math> са бесконачним скупом вредности, математичко очекивање је дефинисано са <math>EX = \sum_k x_k P(X = x_k)</math> (под условом да овај ред апсолутно конвергира)
* За непрекидну случајну променљиву <math>X</math> са густином <math>f(x)</math>, математичко очекивање је дефинисано са <math>EX = \int_{-\infty}^{+\infty} xf(x)dx</math> (под условом да овај интеграл апсолутно конвергира)
* '''Теорема 4.1:''' Нека је <math>X</math> непрекидна случајна променљива са густином <math>f(x)</math> и <math>g</math> функција за коју постоји <math>E(g(X))</math>. Тада је: <math>E(g(X)) = \int_{-\infty}^{+\infty} g(x) f(x) dx</math>.
* '''Теорема 4.2:''' Нека су <math>X</math> и <math>Y</math> случајне променљиве са очекивањима <math>EX</math> и <math>EY</math>, а <math>a, b, c \in \mathbb{R}</math>. Тада важи:
*# <math>E(c) = c</math>
*# <math>E(aX) = aEX</math>
*# <math>E(X + Y) = EX + EY</math>
*# Ако су <math>X</math> и <math>Y</math> независне, онда је <math>E(XY) = EX EY</math>
 
=== Варијанса ===
* '''Варијанса (дисперзија):''' за променљиву <math>X</math> са очекивањем <math>EX</math>, варијанса је <math>VarX = E(X - EX)^2</math>
** '''Стандардна девијација (стандардно одступање):''' <math>S.D.(X) = \sqrt{VarX}</math>
* Особине варијансе за <math>a, c \in \mathbb{R}</math>:
*# <math>Var(c) = 0</math>
*#* Доказ: <math>Var(c) = E(c - E(c))^2 = E(c - c)^2 = 0</math>
*# <math>VarX = 0 \implies P(X = c) = 1</math> за неко <math>c</math>
*#* Доказ: није доказивано.
*# <math>VarX = E(X^2) - (EX)^2</math>
*#* Доказ: <math>VarX = E(X - EX)^2 =</math><math> E(X^2 - 2EX \cdot X + (EX)^2) =</math><math>E(X^2) + E(-2EX \cdot X) + E((EX)^2) =</math><math> E(X^2) - 2EX \cdot EX + (EX)^2 =</math><math> E(X^2) - (EX)^2</math>
*# <math>Var(X + a) = VarX</math>
*# <math>Var(aX) = a^2 VarX</math>
*# Ако су <math>X</math> и <math>Y</math> независне са коначним варијансама, онда је <math>Var(X + Y) = VarX + VarY</math>
* '''Коваријанса:''' <math>Cov(X, Y) = E[(X - EX)(Y - EY)]</math> (одступање од очекиване вредности обе променљиве)
** '''Теорема 4.3:''' <math>Cov(X, Y) = E(XY) - EX \cdot EY</math>
*** Доказ: <math>Cov(X, Y) =</math><math> E(XY - EX \cdot Y - X \cdot EY + EX \cdot EY) =</math><math> E(XY) + E(-EX \cdot Y) + E(-X \cdot EY) + E(EX \cdot EY) =</math><math> E(XY) - EX \cdot EY - EY \cdot EX + EX \cdot EY =</math><math> E(XY) - EX \cdot EY</math>
** '''Теорема 4.4:''' <math>Var(X + Y) = VarX + VarY + 2Cov(X, Y)</math>
*** Доказ: <math>Var(X + Y) =</math><math> E(X + Y - E(X + Y))^2 =</math><math> E(X + Y - EX - EY)^2 =</math><math> E((X - EX) + (Y - EY))^2 =</math><math> E((X - EX)^2 + 2(X - EX)(Y - EY) + (Y - EY)^2) =</math><math> VarX + VarY + 2Cov(X, Y)</math>
* Особине коваријансе за променљиве <math>X, Y, Z</math> и <math>a, b \in \mathbb{R}</math>:
*# Ако су <math>X</math> и <math>Y</math> независне, <math>Cov(X, Y) = 0</math>.
*# <math>Cov(X, Y) = Cov(Y, X)</math>
*# <math>Cov(X, X) = VarX</math>
*# <math>Cov(aX, bY) = abCov(X, Y)</math>
*# <math>Cov(X + Y, Z) = Cov(X, Z) + Cov(Y, Z)</math>
*# <math>Cov(X + a, Y + b) = Cov(X, Y)</math>
* '''Коефицијент корелације:''' <math>\rho(X, Y) = \frac{Cov(X, Y)}{\sqrt{VarX} \sqrt{VarY} }</math> (за <math>VarX, VarY > 0</math>)
** '''Теорема 4.5:'''
**# <math>-1 \leq \rho(X, Y) \leq 1</math>
**#* Доказ: уочимо случајну променљиву <math>\frac{X}{\sqrt{VarX} } + \frac{Y}{\sqrt{VarY} }</math>. <math>0 \leq Var\left(\frac{X}{\sqrt{VarX} } + \frac{Y}{\sqrt{VarY} }\right) =</math><math> Var\left(\frac{X}{\sqrt{VarX} }\right) + Var\left(\frac{Y}{\sqrt{VarY} }\right) + 2Cov\left(\frac{X}{\sqrt{VarX} }, \frac{Y}{\sqrt{VarY} }\right) =</math><math> \frac{1}{\sqrt{VarX}^2} \cdot VarX + \frac{1}{\sqrt{VarY}^2} \cdot VarY + \frac{2}{\sqrt{VarX} \cdot \sqrt{VarY} } Cov(X, Y) =</math><math> 2 + 2\rho(X, Y)</math>. Како је <math>2 + 2\rho(X, Y) \geq 0</math>, онда важи <math>\rho \geq -1</math>. Аналогно томе, уколико уочимо случајну променљиву са - уместо + добијамо <math>\rho \leq 1</math>.
**# <math>\rho(X, Y) = \pm 1</math> ако и само ако <math>P(Y = aX + b) = 1</math>, где је <math>\DeclareMathOperator{\sgn}{sgn}a \neq 0, b \in \mathbb{R}, \sgn a = \sgn \rho(X, Y)</math>
**# <math>\rho(aX + b, cY + d) = \pm \rho(X, Y)</math> за <math>a, c \in \mathbb{R} \setminus \{0\}, b, d \in \mathbb{R}</math>, где се узима знак плус ако је <math>ac</math> позитивно, а минус у супротном
** Корелација:
*** <math>\rho(X, Y) = 0 \implies</math> променљиве су некорелисане
*** <math>\rho(X, Y) > 0 \implies</math> променљиве су позитивно корелисане
*** <math>\rho(X, Y) < 0 \implies</math> променљиве су негативно корелисане
** '''Моменти:'''
*** <math>E(X^k)</math>: моменат реда <math>k</math>
*** <math>E|X|^k</math>: апсолутни моменат реда <math>k</math>
*** <math>E(X - EX)^k</math>: централни моменат реда <math>k</math>
** '''Квантили:''' за дату случајну променљиву <math>X</math> са расподелом <math>F(x)</math>, квантил реда <math>p</math> је сваки број <math>x</math> за који важи <math>F(x^-) \leq p \leq F(x)</math>.
*** За сваку расподелу и за свако <math>p</math> постоји бар један квантил тог реда.
*** Ознака: <math>\varepsilon_p</math>
*** <math>\varepsilon_{\frac{1}{2} }</math>: медијана (мера средње вредности)
*** <math>\varepsilon_{\frac{1}{4} }</math>: први квартил
*** <math>\varepsilon_{\frac{3}{4} }</math>: други квартил
 
=== Нумеричке карактеристике расподела ===
{| class="wikitable"
|+ Нумеричке карактеристике честих расподела
! Расподела
! Математичко очекивање
! Варијанса
|-
| <math>Bern(p)</math>
| <math>p</math>
| <math>qp</math>
|-
| <math>Bin(n, p)</math>
| <math>np</math>
| <math>npq</math>
|-
| <math>Poiss(\lambda)</math>
| <math>\lambda</math>
| <math>\lambda</math>
|-
| <math>Exp(\lambda)</math>
| <math>\frac{1}{\lambda}</math>
| <math>\frac{1}{\lambda^2}</math>
|-
| <math>Unif(a, b)</math>
| <math>\frac{a+b}{2}</math>
| <math>\frac{(b-a)^2}{12}</math>
|-
| <math>\mathcal{N}(\mu, \sigma^2)</math>
| <math>\mu</math>
| <math>\sigma^2</math>
|}
 
== Карактеристичне функције ==
* Дефинише се као <math>\varphi_X(t) = Ee^{itX}</math>.
** За дискретно <math>X</math>: <math>\varphi_X = \sum_k e^{itx_k} P(X = x_k)</math> за све вредности <math>x_k</math>
** За непрекидно <math>X</math>: <math>\varphi_X = \int_{-\infty}^{+\infty} e^{itx} f(x) dx</math>, где <math>f(x)</math> означава густину
* '''Теорема 5.1:'''
*# За сваку случајну променљиву постоји одговарајућа карактеристична функција
*# Различитим карактеристичним функцијама одговарају различите расподеле и обрнуто
*# За сваку случајну променљиву и свака два реална или комплексна броја важи <math>\varphi_{aX+b}(t) = e^{ibt} \varphi_X(at)</math>
*# Ако случајна променљива има момент реда <math>n</math> тада важи <math>E(X^n) = i^{-n} \varphi^{(n)}(0)</math>
*# За две независне случајне променљиве важи <math>\varphi_{X + Y}(t) = \varphi_X(t) \varphi_Y(t)</math>
*#* Доказ: <math>\varphi_{X + Y}(t) = Ee^{it(X+Y)} = Ee^{itX} Ee^{itY} = \varphi_X(t) \varphi_Y(t)</math>
 
== Граничне теореме ==
* Низ случајних променљивих <math>\{X_n\}</math>:
** '''строго конвергира''' (конвергира скоро свуда) ка <math>X</math> ако <math>P\left(\lim_{n \to \infty} X_n = X\right) = 1</math>
** '''конвергира у вероватноћи''' ка <math>X</math> ако је <math>\lim_{n \to \infty} P\left(\left|X_n - X\right|\geq \varepsilon\right) = 0</math> за свако <math>\varepsilon > 0</math>
** '''конвергира у расподели''' (слабо конвергира) ка <math>X</math> ако <math>\lim_{n \to \infty} F_{X_n}(x) = F_X(x)</math> у свакој тачки <math>x \in \mathbb{R}</math> у којој је <math>F_X(x)</math> непрекидна
** '''<math>L_p</math>-конвергира''' ка <math>X</math> за <math>p \geq 1</math> ако <math>\lim_{n \to \infty} E\left|X_n - X\right|^p = 0</math>
*** За <math>p = 2</math> се каже да '''конвергира у средњем квадратном''' ка <math>X</math>
* Из строге конвергенције следи конвергенција у вероватноћи, из конвергенције у вероватноћи следи конвергенција у расподели, а из <math>L_p</math> конвергенције такође следи конвергенција у вероватноћи.
* '''Теорема 6.1:''' (теорема о непрекидности) Нека је <math>X_n</math> низ случајних променљивих са карактеристичним функцијама <math>\varphi_n</math> и нека је <math>X</math> случајна променљива са карактеристичном функцијом <math>\varphi</math>. Низ <math>X_n</math> конвергира у расподели ка <math>X</math> ако и само ако је <math>\lim_{n \to \infty} \varphi_n(t) = \varphi(t)</math> за свако <math>t \in \mathbb{R}</math>.
* '''Теорема 6.2:''' (апроксимација биномне расподеле Пуасоновом) ако <math>X \sim Bin(n, p)</math> и ако <math>np < 5, n \geq 30</math> онда <math>X \sim Poiss(np)</math>
* '''Теорема 6.3:''' (неједнакост Маркова) ако је <math>X</math> ненегативна случајна променљива и постоји <math>EX</math>, онда <math>P(X \geq \varepsilon) \leq \frac{EX}{\varepsilon}</math> за свако <math>\varepsilon > 0</math>
* '''Теорема 6.4:''' (неједнакост Чебишева) ако постоји <math>VarX</math>, тада је <math>P\left(\left|X - EX\right| \geq \varepsilon\right) \leq \frac{VarX}{\varepsilon^2}</math> за свако <math>\varepsilon > 0</math>
** Доказ: на основу неједнакости Маркова, <math>P\left(\left|X - EX\right| \geq \varepsilon\right) = P((X - EX)^2 \geq \varepsilon^2) \leq \frac{E(X - EX)^2}{\varepsilon^2} = \frac{VarX}{\varepsilon^2}</math>
* '''Теорема 6.5:''' (слаби закон великих бројева) Нека су <math>X_1, X_2...</math> независне случајне променљиве са истим очекивањем <math>\mu</math> и са коначним варијансама <math>VarX_k \leq V</math> за свако <math>k \in \mathbb{N}</math>, где је <math>V</math> позитивна константа. Тада низ аритметичких средина <math>\frac{X_1 + ... + X_n}{n}</math> конвергира у вероватноћи ка <math>\mu</math>.
* '''Теорема 6.6:''' (Борелов строги закон великих бројева) Ако је <math>S_n</math> број успеха у <math>n</math> Бернулијевих експеримената са вероватноћом успеха <math>p</math>. тада је <math>P\left(\lim_{n \to \infty} \frac{S_n}{n} = p\right) = 1</math>
* '''Теорема 6.7:''' (Коломогоровљев строги закон великих бројева)
*# Ако су <math>X_1, ..., X_n</math> независне случајне променљиве са истом расподелом и очекивањем <math>\mu</math>, тада важи <math>P\left(\lim_{n \to \infty} \frac{X_1 + ... + X_n}{n} = \mu\right) = 1</math>
*# Ако су <math>X_1, ..., X_n</math> независне случајне променљиве са истом расподелом и ако постоји <math>b</math> такав да је <math>P\left(\lim_{n \to \infty} \frac{X_1 + ... + X_n}{n} = b\right) = 1</math>, тада све променљиве имају очекивање <math>b</math>
* '''Теорема 6.8:''' (централна гранична теорема) Ако су <math>X_1, X_2...</math> независне, са истом расподелом, очекивањем <math>\mu</math> и коначним варијансама <math>\sigma^2</math>, тада <math>Z_n = \frac{X_1 + ... + X_n - n\mu}{\sigma \sqrt{n} }</math> конвергира у расподели ка <math>Z \sim \mathcal{N}(0, 1)</math>.
** У пракси мора да важи <math>n \geq 30</math>.
* '''Теорема 6.9:''' (апроксимација биномне расподеле нормалном, Моавр-Лапласова теорема) Ако је <math>X \sim Bin(n, p)</math> и <math>Z_n = \frac{X - np}{\sqrt{npq} }</math> тада <math>Z_n</math> конвергира у расподели ка <math>Z \sim \mathcal{N}(0, 1)</math>
** Доказ: следи из централне граничне теореме, <math>X = X_1 + ... + X_n, X_1, ..., X_n \sim Bern(p)</math>
* '''Апроксимација Пуасонове расподеле нормалном:''' <math>X \sim Poiss(\lambda), \lambda \geq 10 \implies X \sim \mathcal{N}(\lambda, \lambda)</math>
 
== Статистика ==
=== Основни појмови ===
* '''Популација:''' скуп <math>\Omega</math> елемената <math>\omega</math> (паралела из вероватноће: скуп исхода)
* '''Обележје:''' нумеричка особина <math>X(\omega)</math> елемената <math>\omega \in \Omega</math> (паралела из вероватноће: случајна променљива)
* '''Статистички експеримент (у пракси):''' регистровање вредности <math>X</math> на неком (правом) подскупу скупа <math>\Omega</math>, који називамо '''узорак'''. На основу узорка доносимо закључке о расподели <math>X</math>.
* '''Случајни узорак''' димензије <math>n</math> је скуп независних случајних променљивих са истом расподелом.
** '''Реализовани узорак''' представља реализоване вредности случајних променљивих у посматраном експерименту.
* '''Статистика''' је случајна променљива <math>f(X_1, X_2, ..., X_n)</math> која зависи само од случајних променљивих из узорка, не и од непознатих параметара расподеле.
** Њена расподела сме да зависи од ових параметара.
** '''Реализована вредност статистике:''' <math>f(x_1, x_2, ..., x_n)</math>
 
=== Оцене параметара ===
* Обележје <math>X</math> има расподелу <math>P_{\theta}</math> која зависи од скупа параметара <math>\theta \in \Theta</math>.
** <math>\Theta</math>: скуп допустивих расподела
** <math>P_{\theta}</math>: фамилија расподела
** Ако не знамо <math>\theta</math> можемо да бирамо узорак и на основу њега оцењујемо <math>\theta</math>.
 
==== Тачкаста оцена ====
* Реализована вредност статистике <math>\hat{\theta}(X_1, ..., X_n)</math>
* Карактеристике:
*# <math>\hat{\theta}(X_1, ..., X_n)</math> је центрирана (непристрасна) ако је <math>E\hat{\theta} = \theta</math> за свако <math>\theta</math>.
*# <math>\hat{\theta}(X_1, ..., X_n)</math> је асимптотски непристрасна ако <math>E\hat{\theta} \to_{n \to \infty} \theta</math>.
*# <math>\hat{\theta}(X_1, ..., X_n)</math> је стабилна (постојана) ако конвергира у вероватноћи ка <math>\theta</math>.
*# Ако су <math>\hat{\theta_1}</math> и <math>\hat{\theta_2}</math> две оцене истог параметра <math>\theta</math>, <math>\hat{\theta_1}</math> је боља од <math>\hat{\theta_2}</math> ако је <math>E(\hat{\theta_1} - \theta)^2 \leq E(\hat{\theta_2} - \theta)^2</math> с тим што строга неједнакост важи за бар једно <math>\theta</math>.
*# Ако су <math>\hat{\theta_1}</math> и <math>\hat{\theta_2}</math> две центриране оцене истог параметра <math>\theta</math>, кажемо да је <math>\hat{\theta_1}</math> ефикасније од <math>\hat{\theta_2}</math> ако је <math>Var\hat{\theta_1} \leq Var\hat{\theta_2}</math> с тим што строга неједнакост важи за бар једно <math>\theta</math>.
 
==== Интервална оцена ====
* '''Интервал поверења:''' је интервал који, за дат узорак обима <math>n</math> из расподеле <math>P_{\theta}</math>, садржи непознати параметар <math>\theta</math> са вероватноћом <math>1-\alpha</math>.
** Двострани интервал поверења: <math>[A, B]</math>
** Једнострани интервал поверења: <math>(-\infty, B]</math> или <math>[A, +\infty)</math>
** <math>A</math> и <math>B</math> су статистике.
* '''Студентова <math>t</math>-расподела:'''
** <math>f(x) = \frac{\Gamma\left(\frac{n+1}{2}\right)}{\sqrt{n\pi} \Gamma\left(\frac{n}{2}\right)} \left(1 + \frac{x^2}{n}\right)^{-\frac{n+1}{2}}</math>
** Гама функција: <math>\Gamma(x) = \int_0^{+\infty} e^{-t} t^{x-1} dt</math>
*** <math>\Gamma(x+1) = x\Gamma(x) \implies \Gamma(n) = (n-1)!</math>
*** <math>\Gamma(1) = 1</math>
*** <math>\Gamma\left(\frac{1}{2}\right) = \sqrt{\pi}</math>
** За <math>n \geq 30</math> можемо апроксимирати са <math>\mathcal{N}(0, 1)</math>
** '''Теорема 7.1:''' Ако су <math>X_1, ..., X_n \sim \mathcal{N}(\mu, \sigma^2)</math> са непознатим <math>\mu</math> и <math>\sigma</math>, нека је <math>\hat{\mu} = \frac{X_1 + ... + X_n}{n}</math> и <math>s^2 = \frac{1}{n-1} \sum_{k = 1}^n (X_k - \hat{\mu})^2</math>, тада важи <math>\frac{\hat{\mu} - \mu}{\frac{s}{\sqrt{n}}} \sim t(n-1)</math>.
* '''Хи квадрат расподела:'''
** <math>f(x) = \begin{cases}
    \frac{1}{2^{\frac{n}{2}} \Gamma\left(\frac{n}{2}\right)} x^{\frac{n}{2} - 1} e^{-\frac{x}{2}}, & x > 0 \\
    0,                                                                                            & x \leq 0
\end{cases}</math>
** '''Теорема 7.2:''' Ако су <math>Z_1, Z_2, ..., Z_n \sim \mathcal{N}(0, 1)</math>, њихов збир има расподелу <math>\chi^2(n)</math>.
** '''Теорема 7.3:''' Ако су <math>X_1, X_2, ..., X_n \sim \mathcal{N}(\mu, \sigma^2)</math> са непознатим <math>\sigma^2</math>:
*** Ако је <math>\mu</math> познато: <math>\frac{nS_0^2}{\sigma^2} \sim \chi^2(n)</math>
*** Ако је <math>\mu</math> непознато: <math>\frac{(n-1)s^2}{\sigma^2} \sim \chi^2(n-1)</math>
{| class="wikitable"
|+ Процена непознатих параметара у интервалима поверења код <math>\mathcal{N}(\mu, \sigma^2)</math>.
! colspan="2" | Процена
! Двострани интервал
! Једнострани интервал
|-
! rowspan="3" | Процена непознатог <math>\mu</math>
! Познато <math>\sigma^2</math>
| <math>\mu \in \left[\hat{\mu} - \varepsilon_{1 - \frac{\alpha}{2}} \frac{\sigma}{\sqrt{n}}, \hat{\mu} + \varepsilon_{1 - \frac{\alpha}{2}} \frac{\sigma}{\sqrt{n}}\right]</math>
| <math>\mu \in \left(-\infty, \hat{\mu} + \varepsilon_{1 - \alpha} \frac{\sigma}{\sqrt{n}}\right]</math> или <math>\mu \in \left[\hat{\mu} - \varepsilon_{1 - \alpha} \frac{\sigma}{\sqrt{n}}, +\infty\right)</math>
|-
! rowspan="2" | Непознато <math>\sigma^2</math>
| colspan="2" | Процењујемо <math>\sigma^2</math>: <math>s^2 = \frac{1}{n-1} \sum_{k = 1}^n (X_k - \hat{\mu})^2</math>, <math>\frac{\hat{\mu} - \mu}{\frac{s}{\sqrt{n}}} \sim t(n-1)</math>
|-
| <math>\mu \in \left[\hat{\mu} - \varepsilon_{1 - \frac{\alpha}{2}} \frac{s}{\sqrt{n}}, \hat{\mu} + \varepsilon_{1 - \frac{\alpha}{2}} \frac{s}{\sqrt{n}}\right]</math>
| <math>\mu \in \left(-\infty, \hat{\mu} + \varepsilon_{1 - \alpha} \frac{s}{\sqrt{n}}\right]</math> или <math>\mu \in \left[\hat{\mu} - \varepsilon_{1 - \alpha} \frac{s}{\sqrt{n}}, +\infty\right)</math>
|-
! rowspan="2" | Процена непознатог <math>\sigma^2</math>
! Познато <math>\mu</math>
| <math>\sigma^2 \in \left[\frac{nS_0^2}{\varepsilon_{1 - \frac{\alpha}{2}}}, \frac{nS_0^2}{\varepsilon_{\frac{\alpha}{2}}}\right]</math>, квантили из <math>\chi^2(n)</math>
| <math>\sigma^2 \in \left[0, \frac{nS_0^2}{\varepsilon_{\alpha}}\right]</math> или <math>\sigma^2 \in \left[\frac{nS_0^2}{\varepsilon_{1 - \alpha}}, +\infty\right)</math>, квантили из <math>\chi^2(n)</math>
|-
! Непознато <math>\mu</math>
| <math>\sigma^2 \in \left[\frac{(n-1)s^2}{\varepsilon_{1 - \frac{\alpha}{2}}}, \frac{(n-1)s^2}{\varepsilon_{\frac{\alpha}{2}}}\right]</math>, квантили из <math>\chi^2(n-1)</math>
| <math>\sigma^2 \in \left[0, \frac{(n-1)s^2}{\varepsilon_{\alpha}}\right]</math> или <math>\sigma^2 \in \left[\frac{(n-1)s^2}{\varepsilon_{1 - \alpha}}, +\infty\right)</math>, квантили из <math>\chi^2(n-1)</math>
|}
* Ако расподела није <math>\mathcal{N}(\mu, \sigma^2)</math>, за <math>n > 30</math> важи централна гранична теорема, тако да можемо апроксимирати интервал поверења као за нормалну расподелу.
 
{| class="wikitable"
|+ Квантили студентове расподеле <math>t(n)</math> (за <math>n > 30</math> се апроксимира нормалном)
!
! colspan="6" | <math>u</math>
|-
! <math>n</math> !! 0.75  !! 0.90  !! 0.95  !! 0.975  !! 0.99  !! 0.995
|-
| 1              || 1.000 || 3.078 || 6.314 || 12.706 || 31.821 || 63.657
|-
| 2              || 0.816 || 1.886 || 2.920 || 4.303  || 6.965  || 9.925
|-
| 3              || 0.765 || 1.638 || 2.353 || 3.182  || 4.541  || 5.841
|-
| 4              || 0.741 || 1.533 || 2.132 || 2.776  || 3.747  || 4.604
|-
| 5              || 0.727 || 1.476 || 2.015 || 2.571  || 3.365  || 4.032
|-
| 6              || 0.718 || 1.440 || 1.943 || 2.447  || 3.143  || 3.707
|-
| 7              || 0.711 || 1.415 || 1.895 || 2.365  || 2.998  || 3.499
|-
| 8              || 0.706 || 1.397 || 1.860 || 2.306  || 2.896  || 3.355
|-
| 9              || 0.703 || 1.383 || 1.833 || 2.262  || 2.821  || 3.250
|-
| 10            || 0.700 || 1.372 || 1.812 || 2.228  || 2.764  || 3.169
|-
| 11            || 0.697 || 1.363 || 1.796 || 2.201  || 2.718  || 3.106
|-
| 12            || 0.695 || 1.356 || 1.782 || 2.179  || 2.681  || 3.055
|-
| 13            || 0.694 || 1.350 || 1.771 || 2.160  || 2.650  || 3.012
|-
| 14            || 0.692 || 1.345 || 1.761 || 2.145  || 2.624  || 2.977
|-
| 15            || 0.691 || 1.341 || 1.753 || 2.131  || 2.602  || 2.947
|-
| 16            || 0.690 || 1.337 || 1.746 || 2.120  || 2.583  || 2.921
|-
| 17            || 0.689 || 1.333 || 1.740 || 2.110  || 2.567  || 2.898
|-
| 18            || 0.688 || 1.330 || 1.734 || 2.101  || 2.552  || 2.878
|-
| 19            || 0.688 || 1.328 || 1.729 || 2.093  || 2.539  || 2.861
|-
| 20            || 0.687 || 1.325 || 1.725 || 2.086  || 2.528  || 2.845
|-
| 21            || 0.686 || 1.323 || 1.721 || 2.080  || 2.518  || 2.831
|-
| 22            || 0.686 || 1.321 || 1.717 || 2.074  || 2.508  || 2.819
|-
| 23            || 0.685 || 1.319 || 1.714 || 2.069  || 2.500  || 2.807
|-
| 24            || 0.685 || 1.318 || 1.711 || 2.064  || 2.492  || 2.797
|-
| 25            || 0.684 || 1.316 || 1.708 || 2.060  || 2.485  || 2.787
|-
| 26            || 0.684 || 1.315 || 1.706 || 2.056  || 2.479  || 2.779
|-
| 27            || 0.684 || 1.314 || 1.703 || 2.052  || 2.473  || 2.771
|-
| 28            || 0.683 || 1.313 || 1.701 || 2.048  || 2.467  || 2.763
|-
| 29            || 0.683 || 1.311 || 1.699 || 2.045  || 2.462  || 2.756
|-
| 30            || 0.683 || 1.310 || 1.697 || 2.042  || 2.457  || 2.750
|}
{| class="wikitable"
|+ Квантили <math>\chi^2(n)</math> расподеле (за <math>n > 30</math> се апроксимира нормалном)
!
! colspan="8" | <math>u</math>
|-
! <math>n</math> !! 0.005  !! 0.01    !! 0.025  !! 0.05    !! 0.95  !! 0.975  !! 0.99  !! 0.995
|-
| 1              || 0.00004 || 0.00016 || 0.00098 || 0.00393 || 3.841  || 5.024  || 6.635  || 7.879
|-
| 2              || 0.010  || 0.0201  || 0.0506  || 0.103  || 5.991  || 7.378  || 9.210  || 10.597
|-
| 3              || 0.072  || 0.115  || 0.216  || 0.352  || 7.815  || 9.348  || 11.345 || 12.838
|-
| 4              || 0.207  || 0.297  || 0.484  || 0.711  || 9.488  || 11.143 || 13.277 || 14.860
|-
| 5              || 0.412  || 0.554  || 0.831  || 1.145  || 11.070 || 12.832 || 13.086 || 16.750
|-
| 6              || 0.676  || 0.872  || 1.237  || 1.635  || 12.592 || 14.449 || 16.812 || 18.548
|-
| 7              || 0.989  || 1.239  || 1.690  || 2.167  || 14.067 || 16.013 || 18.475 || 20.278
|-
| 8              || 1.344  || 1.646  || 2.180  || 2.733  || 15.507 || 17.535 || 20.090 || 21.955
|-
| 9              || 1.735  || 2.088  || 2.700  || 3.325  || 16.919 || 19.023 || 21.666 || 23.589
|-
| 10            || 2.156  || 2.558  || 3.247  || 3.940  || 18.307 || 20.483 || 23.209 || 25.188
|-
| 11            || 2.603  || 3.053  || 3.816  || 4.575  || 19.675 || 21.920 || 24.725 || 26.757
|-
| 12            || 3.074  || 3.571  || 4.404  || 5.226  || 21.026 || 23.337 || 26.217 || 28.300
|-
| 13            || 3.565  || 4.107  || 5.009  || 5.892  || 22.362 || 24.736 || 27.688 || 29.819
|-
| 14            || 4.075  || 4.660  || 5.629  || 6.571  || 23.685 || 26.119 || 29.141 || 31.319
|-
| 15            || 4.601  || 5.229  || 6.262  || 7.261  || 24.996 || 27.488 || 30.578 || 32.801
|-
| 16            || 5.142  || 5.812  || 6.908  || 7.962  || 26.296 || 28.845 || 32.000 || 24.267
|-
| 17            || 5.697  || 6.408  || 7.564  || 8.672  || 27.587 || 30.191 || 33.409 || 35.718
|-
| 18            || 6.265  || 7.015  || 8.231  || 9.390  || 28.869 || 31.526 || 34.805 || 37.156
|-
| 19            || 6.844  || 7.633  || 8.907  || 10.117  || 30.144 || 32.852 || 36.191 || 38.582
|-
| 20            || 7.434  || 8.260  || 9.591  || 10.851  || 31.410 || 34.170 || 37.566 || 39.997
|-
| 21            || 8.034  || 8.897  || 10.283  || 11.591  || 32.671 || 35.479 || 38.932 || 41.401
|-
| 22            || 8.643  || 9.542  || 10.982  || 12.338  || 33.924 || 36.781 || 40.289 || 42.796
|-
| 23            || 9.260  || 10.196  || 11.689  || 13.091  || 35.172 || 38.076 || 41.638 || 44.181
|-
| 24            || 9.886  || 10.856  || 12.401  || 13.484  || 36.415 || 39.364 || 42.980 || 45.558
|-
| 25            || 10.520  || 11.524  || 13.120  || 14.611  || 37.652 || 40.646 || 44.314 || 46.928
|-
| 26            || 11.160  || 12.198  || 13.844  || 15.379  || 38.885 || 41.923 || 45.642 || 48.290
|-
| 27            || 11.808  || 12.879  || 14.573  || 16.151  || 40.113 || 43.194 || 46.963 || 49.645
|-
| 28            || 12.461  || 13.565  || 15.308  || 16.928  || 41.337 || 44.461 || 48.278 || 50.993
|-
| 29            || 13.121  || 14.256  || 16.047  || 17.708  || 42.557 || 45.772 || 49.588 || 52.336
|-
| 30            || 13.787  || 14.953  || 16.791  || 18.493  || 43.773 || 46.979 || 50.892 || 53.672
|}
 
=== Тестирање параметарских хипотеза ===
* Ознаке:
** <math>H_0</math>: нулта хипотеза
*** <math>H_0: \theta \in \Theta_0</math>
** <math>H_1</math>: алтернативна хипотеза
*** <math>H_1: \theta \in \Theta_1</math>
*** Увек важи да <math>\Theta_0 \cap \Theta_1 = \varnothing</math>
*** Најчешће важи да <math>\Theta_0 \cup \Theta_1 = \Theta</math>
** <math>S</math>: статистика теста
** <math>C</math>: област одбацивања (критична област), хипотезу одбацујемо ако <math>S \in C</math>, иначе не одбацујемо
** <math>\gamma(\theta)</math>: моћ теста, односно вероватноћа да ће <math>H_0</math> бити одбачена
*** <math>\gamma(\theta) = P(S \in C)</math>
** <math>\alpha(\theta)</math>: вероватноћа грешке првог реда, односно вероватноћа одбацивања <math>H_0</math> иако је тачна
*** <math>\alpha(\theta) = \gamma(\theta)</math> за <math>\theta \in \Theta_0</math>
** <math>\alpha = \sup_{\theta \in \Theta_0} \alpha(\theta)</math>: ниво значајности теста
** <math>c</math>: критична вредност теста (граница области одбацивања)
*** Пример: <math>C = [c, +\infty)</math>, <math>C = (-\infty, c]</math>
* Померањем области одбацивања грешка једног реда расте а другог се смањује.
** Уколико желимо да смањимо обе грешке треба да повећамо обим узорка.
* Начини тестирања параметарских хипотеза (обрађени на вежбама):
*# ...
*# преко интервала поверења
*# помоћу <math>p</math> вредности: <math>p = \sup P(S = s)</math> (или <math>S \leq s</math>, <math>S \geq s</math>)
 
=== Тестирање непараметарских хипотеза ===
* Начини тестирања непараметарских хипотеза:
** Поређењем хистограма: <math>\chi^2</math> тест
** Поређењем функција расподеле: тест Колмогоров-Смирнова
* Емипиријска функција расподеле: <math>F_n(x) = \begin{cases}
    0, & x < X_{(1)} \\
    \frac{k}{n}, & X_{(k)} \leq x < X_{(k+1)} \\
    1, & x \geq X_{(n)}
\end{cases}</math>
* '''Теорема 7.4''' (Гливенко-Кантели): Нека је <math>F_n</math> емпиријска функција расподеле добијена из независног узорка обима <math>n</math> из расподеле са функцијом расподеле <math>F</math>. Тада је <math>P(\lim_{n \to \infty} \sup_{x \in \mathbb{R}} \left|F_n(x) - F(x)\right| = 0) = 1</math>
* '''Теорема 7.5:''' Нека је <math>F_n</math> емпиријска функција расподеле добијена из независног узорка обима <math>n</math> из расподеле са функцијом расподеле <math>F</math>. Тада је <math>\lim_{n \to \infty} P(\sqrt{n} \sup_{x \in \mathbb{R}} \left|F_n(x) - F(x)\right| \leq t) = K(t)</math>.
** <math>K(t)</math> се назива Колмогоровом функцијом расподеле
* '''Тест Колмогоров-Смирнова:'''ако је <math>F_0</math> функција расподеле непрекидне случајне променљиве и ми тестирамо <math>H_0: F = F_0</math>, онда важи да <math>\sqrt{n} \sup_{x \in \mathbb{R}} \left|F_n(x) - F(x)\right| > \varepsilon_{1 - \alpha} \implies</math> одбацујемо хипотезу (ако је квантил из <math>K(t)</math>).


[[Категорија:Вероватноћа и статистика]]
[[Категорија:Вероватноћа и статистика]]
[[Категорија:Водичи]]
[[Категорија:Водичи]]

Тренутна верзија на датум 22. април 2024. у 22:47

Теорија са предавања може, поред задатака, доћи на колоквијумима. Испод је излистана сажета теорија, без додатних примера, ради вежбања за колоквијум.

Увод

Основни појмови

  • Статистички експеримент:
    • може да се понови више пута под истим условима
    • познати су нам сви могући исходи (нотација: )
    • не знамо унапред шта ће се десити у конкретном експерименту
    • Скуп свих исхода (нотација: ) може бити коначан (бацање новчића), бесконачан, а уколико је бесконачан може бити пребројив (бацање коцке док не падне 6) и непребројив (бирање реалног броја из интервала)
  • Догађај: подскуп (нотација: , , ...)
    • Догађај се реализује у експерименту ако се оствари у једном од исхода који су његови елементи.
    • Операције над догађајима:
      • : A или B
      • : A и B (нотација за пресек се не користи)
      • : A, али не B
      • , , : супротан догађај ()

Вероватноћа

  • Аксиоме вероватноће: Вероватноћа је функција дефинисана над подскуповима неког скупа ако важи:
    1. , где су који су међусобно искључиви и којих има коначно или пребројиво бесконачно
  • Статистичко одређивање вероватноће: изводимо експеримент пута и региструјемо догађај , тако да нам је број реализација догађаја :
    • релативна фреквенција догађаја:
  • Модел једнаковероватности исхода: ако су сви исходи из скупа једнаковероватни а број чланова је , онда се вероватноћа догађаја може одредити као количник броја повољних и свих исхода:
  • Геометријска вероватноћа: за непребројив скуп који може да се представи геометријски као ограничени објекат (интервал праве, лик у равни, тело у простору) и догађај важи где је мера тог објекта (дужина, површина, запремина).
    • Услов: једнаковероватни догађаји су представљени скуповима исте мере и обрнуто

Особине вероватноће

  • Теорема 1.1:
    • Доказ: како су и међусобно искључиви, важи , па из и трећег аксиома вероватноће добијамо .
  • Теорема 1.2:
    • Доказ: из и теореме 1.1 следи да је
  • Теорема 1.3:
    • Доказ:
      • Ако су A и B међусобно искључиви, важи да је , па важи да је
      • Ако нису, важи да је , па из трећег аксиома добијамо
  • Теорема 1.4:
    • Доказ: , а пошто по другој аксиоми онда следи
  • Теорема 1.5:
    • Доказ:
      • Ако су међусобно искључиви, тако да доказ следи по трећој аксиоми
      • Ако нису, по трећој аксиоми и теореми 1.3
    • Такође важи и

Условна вероватноћа и независност догађаја

Условна вероватноћа

  • Условна вероватноћа догађаја A под условом да се реализовао догађај B: за
  • Теорема 2.1: Нека је и . Функција је вероватноћа.
    • Доказ:
      1. За важи . Пошто је и , важи да је . Пошто је , из теореме 1.4 следи да је , односно
      2. Ако су међусобно искључиви догађаји којих има коначно или пребројиво много, добијамо . Пошто су скупови међусобно искључиви, на основу треће аксиоме следи
      • Како су доказане све три аксиоме вероватноће, доказано је и да је условна вероватноћа, такође, вероватноћа.

Независност догађаја

  • Независност догађаја: Догађаји A и B су статистички независни ако важи .
  • Независност по паровима: Ако су свака два од (за ) независна, онда су ти догађаји независни по паровима.
  • Независност више догађаја у целини: Ако за сваки подскуп скупа догађаја , где је важи , онда су догађаји из тог скупа међусобно независни.
  • Теорема 2.2: Ако су догађаји независни и ако је догађај добијен од догађаја () применом коначно много скуповних операција, онда су и догађаји такође независни.
    • Доказ: није доказивано.
  • Теорема 2.3: За догађаје () важи:
    • Доказ: за је ово дефиниција условне вероватноће, за остатак се доказује индукцијом.
  • Потпун скуп хипотеза: Ако су догађаји међусобно искључиви и важи онда они чине потпун скуп хипотеза.
  • Тотална вероватноћа:
  • Бајесова формула: За , важи
  • Поузданост уређаја: вероватноћа да је уређај исправан, која зависи од поузданости његових компоненти. Две компоненте могу међусобно бити повезане редно или паралелно, и у зависности од тога одређујемо укупну поузданост те две компоненте.
    • Редно:
    • Паралелно:

Случајне променљиве

  • Случајна променљива: пресликавање скупа свих исхода у скуп реалних бројева.
    • Ознака: где је скуп свих бројева у које се пресликавају исходи.
    • На основу пребројивости скупа случајне променљиве се деле на две категорије:
      • Дискретне: уколико је овај скуп коначан или пребројив, и
      • Непрекидне (мешовите): уколико је овај скуп непребројив.
  • Расподела случајне променљиве: функција дефинисана над скуповима реалних бројева,
    • Закон расподеле вероватноће случајне променљиве: за неку случајну променљиву , чији је скуп вредности , то је скуп вероватноћа где је за све
    • Ознака: , тако да

Непрекидне случајне променљиве

  • Функција расподеле: , за
  • Особине функције расподеле:
    1. је монотоно неопадајућа функција
    2. је непрекидна са десне стране за свако
    3. има граничну вредност са леве стране у свакој тачки
  • Функција густине расподеле: ако је ненегативна функција дефинисана на и важи , онда је непрекидна случајна променљива а њена функција густине расподеле.
    • је непрекидна је непрекидна
    • Ако има коначно или пребројиво много тачака прекида, у њима се може дефинисати произвољно.
  • Теорема 3.1: За непрекидну случајну променљиву важи:
      • Доказ:
      • Доказ: ако интеграл представимо површином испод функције, није нам битно да ли избацимо нула, једну или две дужи из те површине.
    1. и
  • Теорема 3.2: ако је дефинисана на , непрекидна са десне стране и ако је а , тада постоји случајна променљива којој је функција расподеле.

Расподеле

  1. Бернулијева: (Бернулијева расподела са вероватноћом успеха )
    • Закон:
    • Модел: индикатор догађаја,
  2. Биномна:
    • Закон:
    • Модел: Бернулијева шема је низ Бернулијевих (независних) експеримената, и у сваком експерименту догађај има вероватноћу , а наша случајна променљива јесте број реализација догађаја у изведених експеримената.
  3. Пуасонова:
    • Закон:
    • Модел: број ретких догађаја у јединици времена, тако да је просечан број догађаја
  4. Геометријска:
    • Закон:
    • Модел: изводе се Бернулијеви експерименти до првог успеха, а наша случајна променљива је број неуспеха
  5. Паскалова (обрнута биномна):
    • Закон:
    • Модел: број Бернулијевих експеримената до -тог успеха.
  6. Хипергеометријска:
    • Модел: на располагању је предмета од којих је једне а друге врсте, од њих бирамо предмета () и случајна променљива нам је број предмета прве врсте међу изабраним
    • Закон:
  7. (Дискретна) униформна:
    • Закон: , за
  8. (Непрекидна) униформна:
    • Закон: ( је концентрисана на )
    • Модел: бирамо број из , а случајна променљива нам је да ли је број у (где је )
  9. Експоненцијална:
    • Модел: време између Пуасонових догађаја, где је реципрочно просечно време
    • Закон:
    • Особина одсуства меморије:
  10. Стандардна нормална (стандардна Гаусова):
    • Закон:
      • (неизрачунљиво, али се рачуна на основу таблице, с тим што и )
Вредности (пример: )
X 0 1 2 3 4 5 6 7 8 9
0.0 5000 5040 5080 5120 5160 5199 5239 5279 5319 5359
0.1 5398 5438 5478 5517 5557 5596 5636 5675 5714 5753
0.2 5793 5832 5871 5910 5948 5987 6026 6064 6103 6141
0.3 6179 6217 6255 6293 6331 6368 6406 6443 6480 6517
0.4 6554 6591 6628 6664 6700 6736 6772 6808 6844 6879
0.5 6915 6950 6985 7019 7054 7088 7123 7157 7190 7224
0.6 7257 7291 7324 7357 7389 7422 7454 7486 7517 7549
0.7 7580 7611 7642 7673 7704 7734 7764 7794 7823 7852
0.8 7881 7910 7939 7967 7995 8023 8051 8078 8106 8133
0.9 8159 8186 8212 8238 8264 8289 8315 8340 8365 8389
1.0 8413 8438 8461 8485 8508 8531 8554 8577 8599 8621
1.1 8643 8665 8686 8708 8729 8749 8770 8790 8810 8830
1.2 8849 8869 8888 8907 8925 8944 8962 8980 8997 9015
1.3 9032 9049 9066 9082 9099 9115 9131 9147 9162 9177
1.4 9192 9207 9222 9236 9251 9265 9279 9292 9306 9319
1.5 9332 9345 9357 9370 9382 9394 9406 9418 9429 9441
1.6 9452 9463 9474 9484 9495 9505 9515 9525 9535 9545
1.7 9554 9564 9573 9582 9591 9599 9608 9616 9625 9633
1.8 9641 9649 9656 9664 9671 9678 9686 9693 9699 9706
1.9 9713 9719 9726 9732 9738 9744 9790 9756 9761 9767
2.0 97725 97778 97831 97882 97932 97982 98030 98077 98124 98169
2.1 98214 98257 98300 98341 98382 98422 98461 98500 98537 98574
2.2 98610 98645 98679 98713 98745 98778 98809 98840 98870 98899
2.3 98928 98956 98983 99010 99036 99061 99086 99111 99134 99158
2.4 99180 99202 99224 99245 99266 99286 99305 99324 99343 99361
2.5 99379 99396 99413 99430 99446 99461 99477 99492 99506 99520
2.6 99534 99547 99560 99573 99585 99598 99609 99621 99632 99643
2.7 99653 99664 99674 99683 99693 99702 99711 99720 99728 99736
2.8 99744 99752 99760 99767 99774 99781 99788 99795 99801 99807
2.9 99813 99819 99825 99831 99836 99841 99846 99851 99856 99861
3.0 998650 998694 998736 998777 998817 998856 998893 998930 998965 998999
3.1 999032 999065 999096 999126 999155 999184 999211 999238 999264 999289
3.2 999313 999336 999359 999381 999402 999423 999443 999462 999481 999499
3.3 999517 999534 999550 999566 999581 999596 999610 999624 999638 999651
3.4 999663 999675 999687 999698 999709 999720 999730 999740 999749 999758

Случајни вектори

  • Случајни вектор: скуп случајних променљивих дефинисаних на истом скупу исхода
  • Заједнички закон расподеле: одређен је ако су познате све вероватноће за све вредности и које случајне променљиве узимају
  • Маргинални закони расподеле: појединачни закони расподеле случајних променљивих у вектору, добијени из заједничког закона као
  • Заједничка функција расподеле: за све
  • Заједничка функција густине: Ако постоји ненегативна функција дефинисана за таква да онда је непрекидан случајни вектор а његова заједничка густина. Њене особине су:
  • Маргиналне функције густине:

Независност случајних променљивих

  • су независне ако су догађаји независни за све могуће
  • Услови независности:
    1. Ако у свакој тачки важи где је заједничка функција расподеле а су маргиналне функције расподеле.
    2. Ако су и дискретне и важи за све вредности и .
    3. Ако су и непрекидне и важи где је заједничка функција густине а су маргиналне функције густине.

Варијациони низ

  • Ако су независне случајне променљиве са истом расподелом које означавају вредности добијене у неким догађајима (на пример, резултати бацања коцкице), онда променљиве које носе вредност најмање од ових променљивих, друге најмање од ових променљивих, ... редом чине варијациони низ.
    • Променљиве варијационог низа немају исту расподелу као оригиналне случајне променљиве, и више нису независне.
  • Функција расподеле -те случајне променљиве варијационог низа:
  • Специјални случајеви:
    • Функција расподеле најмање случајне променљиве варијационог низа:
    • Функција расподеле највеће случајне променљиве варијационог низа:

Нумеричке карактеристике случајних променљивих

Математичко очекивање

  • За дискретну случајну променљиву са коначним скупом вредности , математичко очекивање је дефинисано са
  • За дискретну случајну променљиву са бесконачним скупом вредности, математичко очекивање је дефинисано са (под условом да овај ред апсолутно конвергира)
  • За непрекидну случајну променљиву са густином , математичко очекивање је дефинисано са (под условом да овај интеграл апсолутно конвергира)
  • Теорема 4.1: Нека је непрекидна случајна променљива са густином и функција за коју постоји . Тада је: .
  • Теорема 4.2: Нека су и случајне променљиве са очекивањима и , а . Тада важи:
    1. Ако су и независне, онда је

Варијанса

  • Варијанса (дисперзија): за променљиву са очекивањем , варијанса је
    • Стандардна девијација (стандардно одступање):
  • Особине варијансе за :
      • Доказ:
    1. за неко
      • Доказ: није доказивано.
      • Доказ:
    2. Ако су и независне са коначним варијансама, онда је
  • Коваријанса: (одступање од очекиване вредности обе променљиве)
    • Теорема 4.3:
      • Доказ:
    • Теорема 4.4:
      • Доказ:
  • Особине коваријансе за променљиве и :
    1. Ако су и независне, .
  • Коефицијент корелације: (за )
    • Теорема 4.5:
        • Доказ: уочимо случајну променљиву . . Како је , онда важи . Аналогно томе, уколико уочимо случајну променљиву са - уместо + добијамо .
      1. ако и само ако , где је
      2. за , где се узима знак плус ако је позитивно, а минус у супротном
    • Корелација:
      • променљиве су некорелисане
      • променљиве су позитивно корелисане
      • променљиве су негативно корелисане
    • Моменти:
      • : моменат реда
      • : апсолутни моменат реда
      • : централни моменат реда
    • Квантили: за дату случајну променљиву са расподелом , квантил реда је сваки број за који важи .
      • За сваку расподелу и за свако постоји бар један квантил тог реда.
      • Ознака:
      • : медијана (мера средње вредности)
      • : први квартил
      • : други квартил

Нумеричке карактеристике расподела

Нумеричке карактеристике честих расподела
Расподела Математичко очекивање Варијанса

Карактеристичне функције

  • Дефинише се као .
    • За дискретно : за све вредности
    • За непрекидно : , где означава густину
  • Теорема 5.1:
    1. За сваку случајну променљиву постоји одговарајућа карактеристична функција
    2. Различитим карактеристичним функцијама одговарају различите расподеле и обрнуто
    3. За сваку случајну променљиву и свака два реална или комплексна броја важи
    4. Ако случајна променљива има момент реда тада важи
    5. За две независне случајне променљиве важи
      • Доказ:

Граничне теореме

  • Низ случајних променљивих :
    • строго конвергира (конвергира скоро свуда) ка ако
    • конвергира у вероватноћи ка ако је за свако
    • конвергира у расподели (слабо конвергира) ка ако у свакој тачки у којој је непрекидна
    • -конвергира ка за ако
      • За се каже да конвергира у средњем квадратном ка
  • Из строге конвергенције следи конвергенција у вероватноћи, из конвергенције у вероватноћи следи конвергенција у расподели, а из конвергенције такође следи конвергенција у вероватноћи.
  • Теорема 6.1: (теорема о непрекидности) Нека је низ случајних променљивих са карактеристичним функцијама и нека је случајна променљива са карактеристичном функцијом . Низ конвергира у расподели ка ако и само ако је за свако .
  • Теорема 6.2: (апроксимација биномне расподеле Пуасоновом) ако и ако онда
  • Теорема 6.3: (неједнакост Маркова) ако је ненегативна случајна променљива и постоји , онда за свако
  • Теорема 6.4: (неједнакост Чебишева) ако постоји , тада је за свако
    • Доказ: на основу неједнакости Маркова,
  • Теорема 6.5: (слаби закон великих бројева) Нека су независне случајне променљиве са истим очекивањем и са коначним варијансама за свако , где је позитивна константа. Тада низ аритметичких средина конвергира у вероватноћи ка .
  • Теорема 6.6: (Борелов строги закон великих бројева) Ако је број успеха у Бернулијевих експеримената са вероватноћом успеха . тада је
  • Теорема 6.7: (Коломогоровљев строги закон великих бројева)
    1. Ако су независне случајне променљиве са истом расподелом и очекивањем , тада важи
    2. Ако су независне случајне променљиве са истом расподелом и ако постоји такав да је , тада све променљиве имају очекивање
  • Теорема 6.8: (централна гранична теорема) Ако су независне, са истом расподелом, очекивањем и коначним варијансама , тада конвергира у расподели ка .
    • У пракси мора да важи .
  • Теорема 6.9: (апроксимација биномне расподеле нормалном, Моавр-Лапласова теорема) Ако је и тада конвергира у расподели ка
    • Доказ: следи из централне граничне теореме,
  • Апроксимација Пуасонове расподеле нормалном:

Статистика

Основни појмови

  • Популација: скуп елемената (паралела из вероватноће: скуп исхода)
  • Обележје: нумеричка особина елемената (паралела из вероватноће: случајна променљива)
  • Статистички експеримент (у пракси): регистровање вредности на неком (правом) подскупу скупа , који називамо узорак. На основу узорка доносимо закључке о расподели .
  • Случајни узорак димензије је скуп независних случајних променљивих са истом расподелом.
    • Реализовани узорак представља реализоване вредности случајних променљивих у посматраном експерименту.
  • Статистика је случајна променљива која зависи само од случајних променљивих из узорка, не и од непознатих параметара расподеле.
    • Њена расподела сме да зависи од ових параметара.
    • Реализована вредност статистике:

Оцене параметара

  • Обележје има расподелу која зависи од скупа параметара .
    • : скуп допустивих расподела
    • : фамилија расподела
    • Ако не знамо можемо да бирамо узорак и на основу њега оцењујемо .

Тачкаста оцена

  • Реализована вредност статистике
  • Карактеристике:
    1. је центрирана (непристрасна) ако је за свако .
    2. је асимптотски непристрасна ако .
    3. је стабилна (постојана) ако конвергира у вероватноћи ка .
    4. Ако су и две оцене истог параметра , је боља од ако је с тим што строга неједнакост важи за бар једно .
    5. Ако су и две центриране оцене истог параметра , кажемо да је ефикасније од ако је с тим што строга неједнакост важи за бар једно .

Интервална оцена

  • Интервал поверења: је интервал који, за дат узорак обима из расподеле , садржи непознати параметар са вероватноћом .
    • Двострани интервал поверења:
    • Једнострани интервал поверења: или
    • и су статистике.
  • Студентова -расподела:
    • Гама функција:
    • За можемо апроксимирати са
    • Теорема 7.1: Ако су са непознатим и , нека је и , тада важи .
  • Хи квадрат расподела:
    • Теорема 7.2: Ако су , њихов збир има расподелу .
    • Теорема 7.3: Ако су са непознатим :
      • Ако је познато:
      • Ако је непознато:
Процена непознатих параметара у интервалима поверења код .
Процена Двострани интервал Једнострани интервал
Процена непознатог Познато или
Непознато Процењујемо : ,
или
Процена непознатог Познато , квантили из или , квантили из
Непознато , квантили из или , квантили из
  • Ако расподела није , за важи централна гранична теорема, тако да можемо апроксимирати интервал поверења као за нормалну расподелу.
Квантили студентове расподеле (за се апроксимира нормалном)
0.75 0.90 0.95 0.975 0.99 0.995
1 1.000 3.078 6.314 12.706 31.821 63.657
2 0.816 1.886 2.920 4.303 6.965 9.925
3 0.765 1.638 2.353 3.182 4.541 5.841
4 0.741 1.533 2.132 2.776 3.747 4.604
5 0.727 1.476 2.015 2.571 3.365 4.032
6 0.718 1.440 1.943 2.447 3.143 3.707
7 0.711 1.415 1.895 2.365 2.998 3.499
8 0.706 1.397 1.860 2.306 2.896 3.355
9 0.703 1.383 1.833 2.262 2.821 3.250
10 0.700 1.372 1.812 2.228 2.764 3.169
11 0.697 1.363 1.796 2.201 2.718 3.106
12 0.695 1.356 1.782 2.179 2.681 3.055
13 0.694 1.350 1.771 2.160 2.650 3.012
14 0.692 1.345 1.761 2.145 2.624 2.977
15 0.691 1.341 1.753 2.131 2.602 2.947
16 0.690 1.337 1.746 2.120 2.583 2.921
17 0.689 1.333 1.740 2.110 2.567 2.898
18 0.688 1.330 1.734 2.101 2.552 2.878
19 0.688 1.328 1.729 2.093 2.539 2.861
20 0.687 1.325 1.725 2.086 2.528 2.845
21 0.686 1.323 1.721 2.080 2.518 2.831
22 0.686 1.321 1.717 2.074 2.508 2.819
23 0.685 1.319 1.714 2.069 2.500 2.807
24 0.685 1.318 1.711 2.064 2.492 2.797
25 0.684 1.316 1.708 2.060 2.485 2.787
26 0.684 1.315 1.706 2.056 2.479 2.779
27 0.684 1.314 1.703 2.052 2.473 2.771
28 0.683 1.313 1.701 2.048 2.467 2.763
29 0.683 1.311 1.699 2.045 2.462 2.756
30 0.683 1.310 1.697 2.042 2.457 2.750
Квантили расподеле (за се апроксимира нормалном)
0.005 0.01 0.025 0.05 0.95 0.975 0.99 0.995
1 0.00004 0.00016 0.00098 0.00393 3.841 5.024 6.635 7.879
2 0.010 0.0201 0.0506 0.103 5.991 7.378 9.210 10.597
3 0.072 0.115 0.216 0.352 7.815 9.348 11.345 12.838
4 0.207 0.297 0.484 0.711 9.488 11.143 13.277 14.860
5 0.412 0.554 0.831 1.145 11.070 12.832 13.086 16.750
6 0.676 0.872 1.237 1.635 12.592 14.449 16.812 18.548
7 0.989 1.239 1.690 2.167 14.067 16.013 18.475 20.278
8 1.344 1.646 2.180 2.733 15.507 17.535 20.090 21.955
9 1.735 2.088 2.700 3.325 16.919 19.023 21.666 23.589
10 2.156 2.558 3.247 3.940 18.307 20.483 23.209 25.188
11 2.603 3.053 3.816 4.575 19.675 21.920 24.725 26.757
12 3.074 3.571 4.404 5.226 21.026 23.337 26.217 28.300
13 3.565 4.107 5.009 5.892 22.362 24.736 27.688 29.819
14 4.075 4.660 5.629 6.571 23.685 26.119 29.141 31.319
15 4.601 5.229 6.262 7.261 24.996 27.488 30.578 32.801
16 5.142 5.812 6.908 7.962 26.296 28.845 32.000 24.267
17 5.697 6.408 7.564 8.672 27.587 30.191 33.409 35.718
18 6.265 7.015 8.231 9.390 28.869 31.526 34.805 37.156
19 6.844 7.633 8.907 10.117 30.144 32.852 36.191 38.582
20 7.434 8.260 9.591 10.851 31.410 34.170 37.566 39.997
21 8.034 8.897 10.283 11.591 32.671 35.479 38.932 41.401
22 8.643 9.542 10.982 12.338 33.924 36.781 40.289 42.796
23 9.260 10.196 11.689 13.091 35.172 38.076 41.638 44.181
24 9.886 10.856 12.401 13.484 36.415 39.364 42.980 45.558
25 10.520 11.524 13.120 14.611 37.652 40.646 44.314 46.928
26 11.160 12.198 13.844 15.379 38.885 41.923 45.642 48.290
27 11.808 12.879 14.573 16.151 40.113 43.194 46.963 49.645
28 12.461 13.565 15.308 16.928 41.337 44.461 48.278 50.993
29 13.121 14.256 16.047 17.708 42.557 45.772 49.588 52.336
30 13.787 14.953 16.791 18.493 43.773 46.979 50.892 53.672

Тестирање параметарских хипотеза

  • Ознаке:
    • : нулта хипотеза
    • : алтернативна хипотеза
      • Увек важи да
      • Најчешће важи да
    • : статистика теста
    • : област одбацивања (критична област), хипотезу одбацујемо ако , иначе не одбацујемо
    • : моћ теста, односно вероватноћа да ће бити одбачена
    • : вероватноћа грешке првог реда, односно вероватноћа одбацивања иако је тачна
      • за
    • : ниво значајности теста
    • : критична вредност теста (граница области одбацивања)
      • Пример: ,
  • Померањем области одбацивања грешка једног реда расте а другог се смањује.
    • Уколико желимо да смањимо обе грешке треба да повећамо обим узорка.
  • Начини тестирања параметарских хипотеза (обрађени на вежбама):
    1. ...
    2. преко интервала поверења
    3. помоћу вредности: (или , )

Тестирање непараметарских хипотеза

  • Начини тестирања непараметарских хипотеза:
    • Поређењем хистограма: тест
    • Поређењем функција расподеле: тест Колмогоров-Смирнова
  • Емипиријска функција расподеле:
  • Теорема 7.4 (Гливенко-Кантели): Нека је емпиријска функција расподеле добијена из независног узорка обима из расподеле са функцијом расподеле . Тада је
  • Теорема 7.5: Нека је емпиријска функција расподеле добијена из независног узорка обима из расподеле са функцијом расподеле . Тада је .
    • се назива Колмогоровом функцијом расподеле
  • Тест Колмогоров-Смирнова:ако је функција расподеле непрекидне случајне променљиве и ми тестирамо , онда важи да одбацујемо хипотезу (ако је квантил из ).