Вероватноћа и статистика/Теорија — разлика између измена
Пређи на навигацију
Пређи на претрагу
м (→Нумеричке карактеристике расподела: a+b umesto b-a) |
м (Od danas) |
||
Ред 382: | Ред 382: | ||
** Доказ: следи из централне граничне теореме, <math>X = X_1 + ... + X_n, X_1, ..., X_n \sim Bern(p)</math> | ** Доказ: следи из централне граничне теореме, <math>X = X_1 + ... + X_n, X_1, ..., X_n \sim Bern(p)</math> | ||
* '''Апроксимација Пуасонове расподеле нормалном:''' <math>X \sim Poiss(\lambda), \lambda \geq 10 \implies X \sim \mathcal{N}(\lambda, \lambda)</math> | * '''Апроксимација Пуасонове расподеле нормалном:''' <math>X \sim Poiss(\lambda), \lambda \geq 10 \implies X \sim \mathcal{N}(\lambda, \lambda)</math> | ||
== Статистика == | |||
=== Основни појмови === | |||
* '''Популација:''' скуп <math>\Omega</math> елемената <math>\omega</math> (паралела из вероватноће: скуп исхода) | |||
* '''Обележје:''' нумеричка особина <math>X(\omega)</math> елемената <math>\omega \in \Omega</math> (паралела из вероватноће: случајна променљива) | |||
* '''Статистички експеримент (у пракси):''' регистровање вредности <math>X</math> на неком (правом) подскупу скупа <math>\Omega</math>, који називамо '''узорак'''. На основу узорка доносимо закључке о расподели <math>X</math>. | |||
* '''Случајни узорак''' димензије <math>n</math> је скуп независних случајних променљивих са истом расподелом. | |||
** '''Реализовани узорак''' представља реализоване вредности случајних променљивих у посматраном експерименту. | |||
* '''Статистика''' је случајна променљива <math>f(X_1, X_2, ..., X_n)</math> која зависи само од случајних променљивих из узорка, не и од непознатих параметара расподеле. | |||
** Њена расподела сме да зависи од ових параметара. | |||
** '''Реализована вредност статистике:''' <math>f(x_1, x_2, ..., x_n)</math> | |||
=== Оцене параметара === | |||
* Обележје <math>X</math> има расподелу <math>P_{\theta}</math> која зависи од скупа параметара <math>\theta \in \Theta</math>. | |||
** <math>\Theta</math>: скуп допустивих расподела | |||
** <math>P_{\theta}</math>: фамилија расподела | |||
** Ако не знамо <math>\theta</math> можемо да бирамо узорак и на основу њега оцењујемо <math>\theta</math>. | |||
* Типови оцена: | |||
** '''Тачкаста оцена:''' реализована вредност статистике <math>\hat{\theta}(X_1, ..., X_n)</math> | |||
** '''Интервална оцена:''' интервал облика <math>[A, B]</math> (или једностран) где су <math>A</math> и <math>B</math> статистике које са великом вероватноћом садрже <math>\theta</math>. | |||
* '''Карактеристике тачкасте оцене:''' | |||
*# <math>\hat{\theta}(X_1, ..., X_n)</math> је центрирана (непристрасна) ако је <math>E\hat{\theta} = \theta</math> за свако <math>\theta</math>. | |||
*# <math>\hat{\theta}(X_1, ..., X_n)</math> је асимптотски непристрасна ако <math>E\hat{\theta} \to_{n \to \infty} \theta</math>. | |||
*# <math>\hat{\theta}(X_1, ..., X_n)</math> је стабилна (постојана) ако конвергира у вероватноћи ка <math>\theta</math>. | |||
*# Ако су <math>\hat{\theta_1}</math> и <math>\hat{\theta_2}</math> две оцене истог параметра <math>\theta</math>, <math>\hat{\theta_1}</math> је боља од <math>\hat{\theta_2}</math> ако је <math>E(\hat{\theta_1} - \theta)^2 \leq E(\hat{\theta_2} - \theta)^2</math> с тим што строга неједнакост важи за бар једно <math>\theta</math>. | |||
*# Ако су <math>\hat{\theta_1}</math> и <math>\hat{\theta_2}</math> две оцене истог параметра <math>\theta</math>, кажемо да је <math>\hat{\theta_1}</math> ефикасније од <math>\hat{\theta_2}</math> ако је <math>Var\hat{\theta_1} \leq Var\hat{\theta_2}</math> с тим што строга неједнакост важи за бар једно <math>\theta</math>. | |||
[[Категорија:Вероватноћа и статистика]] | [[Категорија:Вероватноћа и статистика]] | ||
[[Категорија:Водичи]] | [[Категорија:Водичи]] |
Верзија на датум 10. мај 2023. у 13:47
Теорија са предавања може, поред задатака, доћи на колоквијумима. Испод је излистана сажета теорија, без додатних примера, ради вежбања за колоквијум.
Увод
Основни појмови
- Статистички експеримент:
- може да се понови више пута под истим условима
- познати су нам сви могући исходи (нотација: )
- не знамо унапред шта ће се десити у конкретном експерименту
- Скуп свих исхода (нотација: ) може бити коначан (бацање новчића), бесконачан, а уколико је бесконачан може бити пребројив (бацање коцке док не падне 6) и непребројив (бирање реалног броја из интервала)
- Догађај: подскуп (нотација: , , ...)
- Догађај се реализује у експерименту ако се оствари у једном од исхода који су његови елементи.
- Операције над догађајима:
- : A или B
- : A и B (нотација за пресек се не користи)
- : A, али не B
- , , : супротан догађај ()
Вероватноћа
- Аксиоме вероватноће: Вероватноћа је функција дефинисана над подскуповима неког скупа ако важи:
- , где су који су међусобно искључиви и којих има коначно или пребројиво бесконачно
- Статистичко одређивање вероватноће: изводимо експеримент пута и региструјемо догађај , тако да нам је број реализација догађаја :
- релативна фреквенција догађаја:
- Модел једнаковероватности исхода: ако су сви исходи из скупа једнаковероватни а број чланова је , онда се вероватноћа догађаја може одредити као количник броја повољних и свих исхода:
- Геометријска вероватноћа: за непребројив скуп који може да се представи геометријски као ограничени објекат (интервал праве, лик у равни, тело у простору) и догађај важи где је мера тог објекта (дужина, површина, запремина).
- Услов: једнаковероватни догађаји су представљени скуповима исте мере и обрнуто
Особине вероватноће
- Теорема 1.1:
- Доказ: како су и међусобно искључиви, важи , па из и трећег аксиома вероватноће добијамо .
- Теорема 1.2:
- Доказ: из и теореме 1.1 следи да је
- Теорема 1.3:
- Доказ:
- Ако су A и B међусобно искључиви, важи да је , па важи да је
- Ако нису, важи да је , па из трећег аксиома добијамо
- Доказ:
- Теорема 1.4:
- Доказ: , а пошто по другој аксиоми онда следи
- Теорема 1.5:
- Доказ:
- Ако су међусобно искључиви, тако да доказ следи по трећој аксиоми
- Ако нису, по трећој аксиоми и теореми 1.3
- Такође важи и
- Доказ:
Условна вероватноћа и независност догађаја
Условна вероватноћа
- Условна вероватноћа догађаја A под условом да се реализовао догађај B: за
- Теорема 2.1: Нека је и . Функција је вероватноћа.
- Доказ:
- За важи . Пошто је и , важи да је . Пошто је , из теореме 1.4 следи да је , односно
- Ако су међусобно искључиви догађаји којих има коначно или пребројиво много, добијамо . Пошто су скупови међусобно искључиви, на основу треће аксиоме следи
- Како су доказане све три аксиоме вероватноће, доказано је и да је условна вероватноћа, такође, вероватноћа.
- Доказ:
Независност догађаја
- Независност догађаја: Догађаји A и B су статистички независни ако важи .
- Независност по паровима: Ако су свака два од (за ) независна, онда су ти догађаји независни по паровима.
- Независност више догађаја у целини: Ако за сваки подскуп скупа догађаја , где је важи , онда су догађаји из тог скупа међусобно независни.
- Теорема 2.2: Ако су догађаји независни и ако је догађај добијен од догађаја () применом коначно много скуповних операција, онда су и догађаји такође независни.
- Доказ: није доказивано.
- Теорема 2.3: За догађаје () важи:
- Доказ: за је ово дефиниција условне вероватноће, за остатак се доказује индукцијом.
- Потпун скуп хипотеза: Ако су догађаји међусобно искључиви и важи онда они чине потпун скуп хипотеза.
- Тотална вероватноћа:
- Бајесова формула: За , важи
- Поузданост уређаја: вероватноћа да је уређај исправан, која зависи од поузданости његових компоненти. Две компоненте могу међусобно бити повезане редно или паралелно, и у зависности од тога одређујемо укупну поузданост те две компоненте.
- Редно:
- Паралелно:
Случајне променљиве
- Случајна променљива: пресликавање скупа свих исхода у скуп реалних бројева.
- Ознака: где је скуп свих бројева у које се пресликавају исходи.
- На основу пребројивости скупа случајне променљиве се деле на две категорије:
- Дискретне: уколико је овај скуп коначан или пребројив, и
- Непрекидне (мешовите): уколико је овај скуп непребројив.
- Расподела случајне променљиве: функција дефинисана над скуповима реалних бројева,
- Закон расподеле вероватноће случајне променљиве: за неку случајну променљиву , чији је скуп вредности , то је скуп вероватноћа где је за све
- Ознака: , тако да
Непрекидне случајне променљиве
- Функција расподеле: , за
- Особине функције расподеле:
- је монотоно неопадајућа функција
- је непрекидна са десне стране за свако
- има граничну вредност са леве стране у свакој тачки
- Функција густине расподеле: ако је ненегативна функција дефинисана на и важи , онда је непрекидна случајна променљива а њена функција густине расподеле.
- је непрекидна је непрекидна
- Ако има коначно или пребројиво много тачака прекида, у њима се може дефинисати произвољно.
- Теорема 3.1: За непрекидну случајну променљиву важи:
-
- Доказ:
-
- Доказ: ако интеграл представимо површином испод функције, није нам битно да ли избацимо нула, једну или две дужи из те површине.
- и
-
- Теорема 3.2: ако је дефинисана на , непрекидна са десне стране и ако је а , тада постоји случајна променљива којој је функција расподеле.
Расподеле
- Бернулијева: (Бернулијева расподела са вероватноћом успеха )
- Закон:
- Модел: индикатор догађаја,
- Биномна:
- Закон:
- Модел: Бернулијева шема је низ Бернулијевих (независних) експеримената, и у сваком експерименту догађај има вероватноћу , а наша случајна променљива јесте број реализација догађаја у изведених експеримената.
- Пуасонова:
- Закон:
- Модел: број ретких догађаја у јединици времена, тако да је просечан број догађаја
- Геометријска:
- Закон:
- Модел: изводе се Бернулијеви експерименти до првог успеха, а наша случајна променљива је број неуспеха
- Паскалова (обрнута биномна):
- Закон:
- Модел: број Бернулијевих експеримената до -тог успеха.
- Хипергеометријска:
- Модел: на располагању је предмета од којих је једне а друге врсте, од њих бирамо предмета () и случајна променљива нам је број предмета прве врсте међу изабраним
- Закон:
- (Дискретна) униформна:
- Закон: , за
- (Непрекидна) униформна:
- Закон: ( је концентрисана на )
- Модел: бирамо број из , а случајна променљива нам је да ли је број у (где је )
- Закон: ( је концентрисана на )
- Експоненцијална:
- Модел: време између Пуасонових догађаја, где је реципрочно просечно време
- Закон:
- Особина одсуства меморије:
- Стандардна нормална (стандардна Гаусова):
- Закон:
- (неизрачунљиво, али се рачуна на основу таблице, с тим што и )
- Закон:
X | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 |
---|---|---|---|---|---|---|---|---|---|---|
0.0 | 5000 | 5040 | 5080 | 5120 | 5160 | 5199 | 5239 | 5279 | 5319 | 5359 |
0.1 | 5398 | 5438 | 5478 | 5517 | 5557 | 5596 | 5636 | 5675 | 5714 | 5753 |
0.2 | 5793 | 5832 | 5871 | 5910 | 5948 | 5987 | 6026 | 6064 | 6103 | 6141 |
0.3 | 6179 | 6217 | 6255 | 6293 | 6331 | 6368 | 6406 | 6443 | 6480 | 6517 |
0.4 | 6554 | 6591 | 6628 | 6664 | 6700 | 6736 | 6772 | 6808 | 6844 | 6879 |
0.5 | 6915 | 6950 | 6985 | 7019 | 7054 | 7088 | 7123 | 7157 | 7190 | 7224 |
0.6 | 7257 | 7291 | 7324 | 7357 | 7389 | 7422 | 7454 | 7486 | 7517 | 7549 |
0.7 | 7580 | 7611 | 7642 | 7673 | 7704 | 7734 | 7764 | 7794 | 7823 | 7852 |
0.8 | 7881 | 7910 | 7939 | 7967 | 7995 | 8023 | 8051 | 8078 | 8106 | 8133 |
0.9 | 8i59 | 8186 | 8212 | 8238 | 8264 | 8289 | 8315 | 8340 | 8365 | 8389 |
1.0 | 8413 | 8438 | 8461 | 8485 | 8508 | 8531 | 8554 | 8577 | 8599 | 8621 |
1.1 | 8643 | 8665 | 8686 | 8708 | 8729 | 8749 | 8770 | 8790 | 8810 | 8830 |
1.2 | 8849 | 8869 | 8888 | 8907 | 8925 | 8944 | 8962 | 8980 | 8997 | 9015 |
1.3 | 9032 | 9049 | 9066 | 9082 | 9099 | 9115 | 9131 | 9147 | 9162 | 9177 |
1.4 | 9192 | 9207 | 9222 | 9236 | 9251 | 9265 | 9279 | 9292 | 9306 | 9319 |
1.5 | 9332 | 9345 | 9357 | 9370 | 9382 | 9394 | 9406 | 9418 | 9429 | 9441 |
1.6 | 9452 | 9463 | 9474 | 9484 | 9495 | 9505 | 9515 | 9525 | 9535 | 9545 |
1.7 | 9554 | 9564 | 9573 | 9582 | 9591 | 9599 | 9608 | 9616 | 9625 | 9633 |
1.8 | 9641 | 9649 | 9656 | 9664 | 9671 | 9678 | 9686 | 9693 | 9699 | 9706 |
1.9 | 9713 | 9719 | 9726 | 9732 | 9738 | 9744 | 9790 | 9756 | 9761 | 9767 |
2.0 | 97725 | 97778 | 97831 | 97882 | 97932 | 97982 | 98030 | 98077 | 98124 | 98169 |
2.1 | 982i4 | 98257 | 98300 | 98341 | 98382 | 98422 | 98461 | 98500 | 98537 | 98574 |
2.2 | 98610 | 98645 | 98679 | 98713 | 98745 | 98778 | 98809 | 98840 | 98870 | 98899 |
2.3 | 98928 | 98956 | 98983 | 99010 | 99036 | 99061 | 99086 | 99111 | 99134 | 99158 |
2.4 | 99180 | 99202 | 99224 | 99245 | 99266 | 99286 | 99305 | 99324 | 99343 | 99361 |
2.5 | 99379 | 99396 | 99413 | 99430 | 99446 | 99461 | 99477 | 99492 | 99506 | 99520 |
2.6 | 99534 | 99547 | 99560 | 99573 | 99585 | 99598 | 99609 | 99621 | 99632 | 99643 |
2.7 | 99653 | 99664 | 99674 | 99683 | 99693 | 99702 | 99711 | 99720 | 99728 | 99736 |
2.8 | 99744 | 99752 | 99760 | 99767 | 99774 | 99781 | 99788 | 99795 | 99801 | 99807 |
2.9 | 99813 | 99819 | 99825 | 99831 | 99836 | 99841 | 99846 | 99851 | 99856 | 99861 |
3.0 | 998650 | 998694 | 998736 | 998777 | 998817 | 998856 | 998893 | 998930 | 998965 | 998999 |
3.1 | 999032 | 999065 | 999096 | 999126 | 999155 | 999184 | 999211 | 999238 | 999264 | 999289 |
3.2 | 999313 | 999336 | 999359 | 999381 | 999402 | 999423 | 999443 | 999462 | 999481 | 999499 |
3.3 | 999517 | 999534 | 999550 | 999566 | 999581 | 999596 | 999610 | 999624 | 999638 | 999651 |
3.4 | 999663 | 999675 | 999687 | 999698 | 999709 | 999720 | 999730 | 999740 | 999749 | 999758 |
Случајни вектори
- Случајни вектор: скуп случајних променљивих дефинисаних на истом скупу исхода
- Заједнички закон расподеле: одређен је ако су познате све вероватноће за све вредности и које случајне променљиве узимају
- Маргинални закони расподеле: појединачни закони расподеле случајних променљивих у вектору, добијени из заједничког закона као
- Заједничка функција расподеле: за све
- Заједничка функција густине: Ако постоји ненегативна функција дефинисана за таква да онда је непрекидан случајни вектор а његова заједничка густина. Њене особине су:
- Маргиналне функције густине:
Независност случајних променљивих
- су независне ако су догађаји независни за све могуће
- Услови независности:
- Ако у свакој тачки важи где је заједничка функција расподеле а су маргиналне функције расподеле.
- Ако су и дискретне и важи за све вредности и .
- Ако су и непрекидне и важи где је заједничка функција густине а су маргиналне функције густине.
Варијациони низ
- Ако су независне случајне променљиве са истом расподелом које означавају вредности добијене у неким догађајима (на пример, резултати бацања коцкице), онда променљиве које носе вредност најмање од ових променљивих, друге најмање од ових променљивих, ... редом чине варијациони низ.
- Променљиве варијационог низа немају исту расподелу као оригиналне случајне променљиве, и више нису независне.
- Функција расподеле -те случајне променљиве варијационог низа:
- Специјални случајеви:
- Функција расподеле најмање случајне променљиве варијационог низа:
- Функција расподеле највеће случајне променљиве варијационог низа:
Нумеричке карактеристике случајних променљивих
Математичко очекивање
- За дискретну случајну променљиву са коначним скупом вредности , математичко очекивање је дефинисано са
- За дискретну случајну променљиву са бесконачним скупом вредности, математичко очекивање је дефинисано са (под условом да овај ред апсолутно конвергира)
- За непрекидну случајну променљиву са густином , математичко очекивање је дефинисано са (под условом да овај интеграл апсолутно конвергира)
- Теорема 4.1: Нека је непрекидна случајна променљива са густином и функција за коју постоји . Тада је: .
- Теорема 4.2: Нека су и случајне променљиве са очекивањима и , а . Тада важи:
- Ако су и независне, онда је
Варијанса
- Варијанса (дисперзија): за променљиву са очекивањем , варијанса је
- Стандардна девијација (стандардно одступање):
- Особине варијансе за :
-
- Доказ:
- за неко
- Доказ: није доказивано.
-
- Доказ:
- Ако су и независне са коначним варијансама, онда је
-
- Коваријанса: (одступање од очекиване вредности обе променљиве)
- Теорема 4.3:
- Доказ:
- Теорема 4.4:
- Доказ:
- Теорема 4.3:
- Особине коваријансе за независне променљиве и :
- Ако су и независне, .
- Коефицијент корелације: (за )
- Теорема 4.5:
-
- Доказ: уочимо случајну променљиву . . Како је , онда важи . Аналогно томе, уколико уочимо случајну променљиву са - уместо + добијамо .
- ако и само ако , где је Рашчлањивање није успело (Conversion error. Server ("cli") reported: "[INVALID]"): {\displaystyle a \neq 0, b \in \mathbb{R}, \sgn a = \sgn \rho(X, Y)}
- за , где се узима знак плус ако је позитивно, а минус у супротном
-
- Корелација:
- променљиве су некорелисане
- променљиве су позитивно корелисане
- променљиве су негативно корелисане
- Моменти:
- : моменат реда
- : апсолутни моменат реда
- : централни моменат реда
- Квантили: за дату случајну променљиву са расподелом , квантил реда је сваки број за који важи .
- За сваку расподелу и за свако постоји бар један квантил тог реда.
- Ознака:
- : медијана (мера средње вредности)
- : први квартил
- : други квартил
- Теорема 4.5:
Нумеричке карактеристике расподела
Расподела | Математичко очекивање | Варијанса |
---|---|---|
Карактеристичне функције
- Дефинише се као .
- За дискретно : за све вредности
- За непрекидно : , где означава густину
- Теорема 5.1:
- За сваку случајну променљиву постоји одговарајућа карактеристична функција
- Различитим карактеристичним функцијама одговарају различите расподеле и обрнуто
- За сваку случајну променљиву и свака два реална или комплексна броја важи
- Ако случајна променљива има момент реда тада важи
- За две случајне променљиве важи
- Доказ:
Граничне теореме
- Низ случајних променљивих :
- строго конвергира (конвергира скоро свуда) ка ако
- конвергира у вероватноћи ка ако је за свако
- конвергира у расподели (слабо конвергира) ка ако у свакој тачки у којој је непрекидна
- -конвергира ка за ако
- За се каже да конвергира у средњем квадратном ка
- Из строге конвергенције следи конвергенција у вероватноћи, из конвергенције у вероватноћи следи конвергенција у расподели, а из конвергенције такође следи конвергенција у вероватноћи.
- Теорема 6.1: (теорема о непрекидности) Нека је низ случајних променљивих са карактеристичним функцијама и нека је случајна променљива са карактеристичном функцијом . Низ конвергира у расподели ка ако и само ако је за свако .
- Теорема 6.2: (апроксимација биномне расподеле Пуасоновом) ако и ако онда
- Теорема 6.3: (неједнакост Маркова) ако је ненегативна случајна променљива и постоји , онда за свако
- Теорема 6.4: (неједнакост Чебишева) ако постоји , тада је за свако
- Доказ: на основу неједнакости Маркова,
- Теорема 6.5: (слаби закон великих бројева) Нека су независне случајне променљиве са истим очекивањем и са коначним варијансама за свако , где је позитивна константа. Тада низ аритметичких средина конвергира у вероватноћи ка .
- Теорема 6.6: (Борелов строги закон великих бројева) Ако је број успеха у Бернулијевих експеримената са вероватноћом успеха . тада је
- Теорема 6.7: (Коломогоровљев строги закон великих бројева)
- Ако су независне случајне променљиве са истом расподелом и очекивањем , тада важи
- Ако су независне случајне променљиве са истом расподелом и ако постоји такав да је , тада све променљиве имају очекивање
- Теорема 6.8: (централна гранична теорема) Ако су независне, са истом расподелом, очекивањем и коначним варијансама , тада конвергира у расподели ка .
- У пракси мора да важи .
- Теорема 6.9: (апроксимација биномне расподеле нормалном, Моавр-Лапласова теорема) Ако је и тада конвергира у расподели ка
- Доказ: следи из централне граничне теореме,
- Апроксимација Пуасонове расподеле нормалном:
Статистика
Основни појмови
- Популација: скуп елемената (паралела из вероватноће: скуп исхода)
- Обележје: нумеричка особина елемената (паралела из вероватноће: случајна променљива)
- Статистички експеримент (у пракси): регистровање вредности на неком (правом) подскупу скупа , који називамо узорак. На основу узорка доносимо закључке о расподели .
- Случајни узорак димензије је скуп независних случајних променљивих са истом расподелом.
- Реализовани узорак представља реализоване вредности случајних променљивих у посматраном експерименту.
- Статистика је случајна променљива која зависи само од случајних променљивих из узорка, не и од непознатих параметара расподеле.
- Њена расподела сме да зависи од ових параметара.
- Реализована вредност статистике:
Оцене параметара
- Обележје има расподелу која зависи од скупа параметара .
- : скуп допустивих расподела
- : фамилија расподела
- Ако не знамо можемо да бирамо узорак и на основу њега оцењујемо .
- Типови оцена:
- Тачкаста оцена: реализована вредност статистике
- Интервална оцена: интервал облика (или једностран) где су и статистике које са великом вероватноћом садрже .
- Карактеристике тачкасте оцене:
- је центрирана (непристрасна) ако је за свако .
- је асимптотски непристрасна ако .
- је стабилна (постојана) ако конвергира у вероватноћи ка .
- Ако су и две оцене истог параметра , је боља од ако је с тим што строга неједнакост важи за бар једно .
- Ако су и две оцене истог параметра , кажемо да је ефикасније од ако је с тим што строга неједнакост важи за бар једно .