Вероватноћа и статистика/Теорија

Извор: SI Wiki
Пређи на навигацију Пређи на претрагу

Теорија са предавања може, поред задатака, доћи на колоквијумима. Испод је излистана сажета теорија, без додатних примера, ради вежбања за колоквијум.

Увод

Основни појмови

  • Статистички експеримент:
    • може да се понови више пута под истим условима
    • познати су нам сви могући исходи (нотација: )
    • не знамо унапред шта ће се десити у конкретном експерименту
    • Скуп свих исхода (нотација: ) може бити коначан (бацање новчића), бесконачан, а уколико је бесконачан може бити пребројив (бацање коцке док не падне 6) и непребројив (бирање реалног броја из интервала)
  • Догађај: подскуп (нотација: , , ...)
    • Догађај се реализује у експерименту ако се оствари у једном од исхода који су његови елементи.
    • Операције над догађајима:
      • : A или B
      • : A и B (нотација за пресек се не користи)
      • : A, али не B
      • , , : супротан догађај ()

Вероватноћа

  • Аксиоме вероватноће: Вероватноћа је функција дефинисана над подскуповима неког скупа ако важи:
    1. , где су који су међусобно искључиви и којих има коначно или пребројиво бесконачно
  • Статистичко одређивање вероватноће: изводимо експеримент пута и региструјемо догађај , тако да нам је број реализација догађаја :
    • релативна фреквенција догађаја:
  • Модел једнаковероватности исхода: ако су сви исходи из скупа једнаковероватни а број чланова је , онда се вероватноћа догађаја може одредити као количник броја повољних и свих исхода:
  • Геометријска вероватноћа: за непребројив скуп који може да се представи геометријски као ограничени објекат (интервал праве, лик у равни, тело у простору) и догађај важи где је мера тог објекта (дужина, површина, запремина).
    • Услов: једнаковероватни догађаји су представљени скуповима исте мере и обрнуто

Особине вероватноће

  • Теорема 1.1:
    • Доказ: како су и међусобно искључиви, важи , па из и трећег аксиома вероватноће добијамо .
  • Теорема 1.2:
    • Доказ: из и теореме 1.1 следи да је
  • Теорема 1.3:
    • Доказ:
      • Ако су A и B међусобно искључиви, важи да је , па важи да је
      • Ако нису, важи да је , па из трећег аксиома добијамо
  • Теорема 1.4:
    • Доказ: , а пошто по другој аксиоми онда следи
  • Теорема 1.5:
    • Доказ:
      • Ако су међусобно искључиви, тако да доказ следи по трећој аксиоми
      • Ако нису, по трећој аксиоми и теореми 1.3
    • Такође важи и

Условна вероватноћа и независност догађаја

Условна вероватноћа

  • Условна вероватноћа догађаја A под условом да се реализовао догађај B: за
  • Теорема 2.1: Нека је и . Функција је вероватноћа.
    • Доказ:
      1. За важи . Пошто је и , важи да је . Пошто је , из теореме 1.4 следи да је , односно
      2. Ако су међусобно искључиви догађаји којих има коначно или пребројиво много, добијамо . Пошто су скупови међусобно искључиви, на основу треће аксиоме следи
      • Како су доказане све три аксиоме вероватноће, доказано је и да је условна вероватноћа, такође, вероватноћа.

Независност догађаја

  • Независност догађаја: Догађаји A и B су статистички независни ако важи .
  • Независност по паровима: Ако су свака два од (за ) независна, онда су ти догађаји независни по паровима.
  • Независност више догађаја у целини: Ако за сваки подскуп скупа догађаја , где је важи , онда су догађаји из тог скупа међусобно независни.
  • Теорема 2.2: Ако су догађаји независни и ако је догађај добијен од догађаја () применом коначно много скуповних операција, онда су и догађаји такође независни.
    • Доказ: није доказивано.
  • Теорема 2.3: За догађаје () важи:
    • Доказ: за је ово дефиниција условне вероватноће, за остатак се доказује индукцијом.
  • Потпун скуп хипотеза: Ако су догађаји међусобно искључиви и важи онда они чине потпун скуп хипотеза.
  • Тотална вероватноћа:
  • Бајесова формула: За , важи
  • Поузданост уређаја: вероватноћа да је уређај исправан, која зависи од поузданости његових компоненти. Две компоненте могу међусобно бити повезане редно или паралелно, и у зависности од тога одређујемо укупну поузданост те две компоненте.
    • Редно:
    • Паралелно:

Случајне променљиве

  • Случајна променљива: пресликавање скупа свих исхода у скуп реалних бројева.
    • Ознака: где је скуп свих бројева у које се пресликавају исходи.
    • На основу пребројивости скупа случајне променљиве се деле на две категорије:
      • Дискретне: уколико је овај скуп коначан или пребројив, и
      • Непрекидне (мешовите): уколико је овај скуп непребројив.
  • Расподела случајне променљиве: функција дефинисана над скуповима реалних бројева,
    • Закон расподеле вероватноће случајне променљиве: за неку случајну променљиву , чији је скуп вредности , то је скуп вероватноћа где је за све
    • Ознака: , тако да

Непрекидне случајне променљиве

  • Функција расподеле: , за
  • Особине функције расподеле:
    1. је монотоно неопадајућа функција
    2. је непрекидна са десне стране за свако
    3. има граничну вредност са леве стране у свакој тачки
  • Функција густине расподеле: ако је ненегативна функција дефинисана на и важи , онда је непрекидна случајна променљива а њена функција густине расподеле.
    • је непрекидна је непрекидна
    • Ако има коначно или пребројиво много тачака прекида, у њима се може дефинисати произвољно.
  • Теорема 3.1: За непрекидну случајну променљиву важи:
      • Доказ:
      • Доказ: ако интеграл представимо површином испод функције, није нам битно да ли избацимо нула, једну или две дужи из те површине.
    1. и
  • Теорема 3.2: ако је дефинисана на , непрекидна са десне стране и ако је а , тада постоји случајна променљива којој је функција расподеле.

Расподеле

  1. Бернулијева: (Бернулијева расподела са вероватноћом успеха )
    • Закон:
    • Модел: индикатор догађаја,
  2. Биномна:
    • Закон:
    • Модел: Бернулијева шема је низ Бернулијевих (независних) експеримената, и у сваком експерименту догађај има вероватноћу , а наша случајна променљива јесте број реализација догађаја у изведених експеримената.
  3. Пуасонова:
    • Закон:
    • Модел: број ретких догађаја у јединици времена, тако да је просечан број догађаја
  4. Геометријска:
    • Закон:
    • Модел: изводе се Бернулијеви експерименти до првог успеха, а наша случајна променљива је број неуспеха
  5. Паскалова (обрнута биномна):
    • Закон:
    • Модел: број Бернулијевих експеримената до -тог успеха.
  6. Хипергеометријска:
    • Модел: на располагању је предмета од којих је једне а друге врсте, од њих бирамо предмета () и случајна променљива нам је број предмета прве врсте међу изабраним
    • Закон:
  7. (Дискретна) униформна:
    • Закон: , за
  8. (Непрекидна) униформна:
    • Закон: ( је концентрисана на )
    • Модел: бирамо број из , а случајна променљива нам је да ли је број у (где је )
  9. Експоненцијална:
    • Модел: време између Пуасонових догађаја, где је реципрочно просечно време
    • Закон:
    • Особина одсуства меморије:
  10. Стандардна нормална (стандардна Гаусова):
    • Закон:
      • (неизрачунљиво, али се рачуна на основу таблице, с тим што и )
Вредности (пример: )
X 0 1 2 3 4 5 6 7 8 9
0.0 5000 5040 5080 5120 5160 5199 5239 5279 5319 5359
0.1 5398 5438 5478 5517 5557 5596 5636 5675 5714 5753
0.2 5793 5832 5871 5910 5948 5987 6026 6064 6103 6141
0.3 6179 6217 6255 6293 6331 6368 6406 6443 6480 6517
0.4 6554 6591 6628 6664 6700 6736 6772 6808 6844 6879
0.5 6915 6950 6985 7019 7054 7088 7123 7157 7190 7224
0.6 7257 7291 7324 7357 7389 7422 7454 7486 7517 7549
0.7 7580 7611 7642 7673 7704 7734 7764 7794 7823 7852
0.8 7881 7910 7939 7967 7995 8023 8051 8078 8106 8133
0.9 8i59 8186 8212 8238 8264 8289 8315 8340 8365 8389
1.0 8413 8438 8461 8485 8508 8531 8554 8577 8599 8621
1.1 8643 8665 8686 8708 8729 8749 8770 8790 8810 8830
1.2 8849 8869 8888 8907 8925 8944 8962 8980 8997 9015
1.3 9032 9049 9066 9082 9099 9115 9131 9147 9162 9177
1.4 9192 9207 9222 9236 9251 9265 9279 9292 9306 9319
1.5 9332 9345 9357 9370 9382 9394 9406 9418 9429 9441
1.6 9452 9463 9474 9484 9495 9505 9515 9525 9535 9545
1.7 9554 9564 9573 9582 9591 9599 9608 9616 9625 9633
1.8 9641 9649 9656 9664 9671 9678 9686 9693 9699 9706
1.9 9713 9719 9726 9732 9738 9744 9790 9756 9761 9767
2.0 97725 97778 97831 97882 97932 97982 98030 98077 98124 98169
2.1 982i4 98257 98300 98341 98382 98422 98461 98500 98537 98574
2.2 98610 98645 98679 98713 98745 98778 98809 98840 98870 98899
2.3 98928 98956 98983 99010 99036 99061 99086 99111 99134 99158
2.4 99180 99202 99224 99245 99266 99286 99305 99324 99343 99361
2.5 99379 99396 99413 99430 99446 99461 99477 99492 99506 99520
2.6 99534 99547 99560 99573 99585 99598 99609 99621 99632 99643
2.7 99653 99664 99674 99683 99693 99702 99711 99720 99728 99736
2.8 99744 99752 99760 99767 99774 99781 99788 99795 99801 99807
2.9 99813 99819 99825 99831 99836 99841 99846 99851 99856 99861
3.0 998650 998694 998736 998777 998817 998856 998893 998930 998965 998999
3.1 999032 999065 999096 999126 999155 999184 999211 999238 999264 999289
3.2 999313 999336 999359 999381 999402 999423 999443 999462 999481 999499
3.3 999517 999534 999550 999566 999581 999596 999610 999624 999638 999651
3.4 999663 999675 999687 999698 999709 999720 999730 999740 999749 999758

Случајни вектори

  • Случајни вектор: скуп случајних променљивих дефинисаних на истом скупу исхода
  • Заједнички закон расподеле: одређен је ако су познате све вероватноће за све вредности и које случајне променљиве узимају
  • Маргинални закони расподеле: појединачни закони расподеле случајних променљивих у вектору, добијени из заједничког закона као
  • Заједничка функција расподеле: за све
  • Заједничка функција густине: Ако постоји ненегативна функција дефинисана за таква да онда је непрекидан случајни вектор а његова заједничка густина. Њене особине су:
  • Маргиналне функције густине:

Независност случајних променљивих

  • су независне ако су догађаји независни за све могуће
  • Услови независности:
    1. Ако у свакој тачки важи где је заједничка функција расподеле а су маргиналне функције расподеле.
    2. Ако су и дискретне и важи за све вредности и .
    3. Ако су и непрекидне и важи где је заједничка функција густине а су маргиналне функције густине.

Варијациони низ

  • Ако су независне случајне променљиве са истом расподелом које означавају вредности добијене у неким догађајима (на пример, резултати бацања коцкице), онда променљиве које носе вредност најмање од ових променљивих, друге најмање од ових променљивих, ... редом чине варијациони низ.
    • Променљиве варијационог низа немају исту расподелу као оригиналне случајне променљиве, и више нису независне.
  • Функција расподеле -те случајне променљиве варијационог низа:
  • Специјални случајеви:
    • Функција расподеле најмање случајне променљиве варијационог низа:
    • Функција расподеле највеће случајне променљиве варијационог низа:

Нумеричке карактеристике случајних променљивих

Математичко очекивање

  • За дискретну случајну променљиву са коначним скупом вредности , математичко очекивање је дефинисано са
  • За дискретну случајну променљиву са бесконачним скупом вредности, математичко очекивање је дефинисано са (под условом да овај ред апсолутно конвергира)
  • За непрекидну случајну променљиву са густином , математичко очекивање је дефинисано са (под условом да овај интеграл апсолутно конвергира)
  • Теорема 4.1: Нека је непрекидна случајна променљива са густином и функција за коју постоји . Тада је: .
  • Теорема 4.2: Нека су и случајне променљиве са очекивањима и , а . Тада важи:
    1. Ако су и независне, онда је

Варијанса

  • Варијанса (дисперзија): за променљиву са очекивањем , варијанса је
    • Стандардна девијација (стандардно одступање):
  • Особине варијансе за :
      • Доказ:
    1. за неко
      • Доказ: није доказивано.
      • Доказ:
    2. Ако су и независне са коначним варијансама, онда је
  • Коваријанса: (одступање од очекиване вредности обе променљиве)
    • Теорема 4.3:
      • Доказ:
    • Теорема 4.4:
      • Доказ:
  • Особине коваријансе за независне променљиве и :
    1. Ако су и независне, .
  • Коефицијент корелације: (за )
    • Теорема 4.5:
        • Доказ: уочимо случајну променљиву . . Како је , онда важи . Аналогно томе, уколико уочимо случајну променљиву са - уместо + добијамо .
      1. ако и само ако , где је Рашчлањивање није успело (Conversion error. Server ("cli") reported: "[INVALID]"): {\displaystyle a \neq 0, b \in \mathbb{R}, \sgn a = \sgn \rho(X, Y)}
      2. за , где се узима знак плус ако је позитивно, а минус у супротном
    • Корелација:
      • променљиве су некорелисане
      • променљиве су позитивно корелисане
      • променљиве су негативно корелисане
    • Моменти:
      • : моменат реда
      • : апсолутни моменат реда
      • : централни моменат реда
    • Квантили: за дату случајну променљиву са расподелом , квантил реда је сваки број за који важи .
      • За сваку расподелу и за свако постоји бар један квантил тог реда.
      • Ознака:
      • : медијана (мера средње вредности)
      • : први квартил
      • : други квартил

Нумеричке карактеристике расподела

Нумеричке карактеристике честих расподела
Расподела Математичко очекивање Варијанса

Карактеристичне функције

  • Дефинише се као .
    • За дискретно : за све вредности
    • За непрекидно : , где означава густину
  • Теорема 5.1:
    1. За сваку случајну променљиву постоји одговарајућа карактеристична функција
    2. Различитим карактеристичним функцијама одговарају различите расподеле и обрнуто
    3. За сваку случајну променљиву и свака два реална или комплексна броја важи
    4. Ако случајна променљива има момент реда тада важи
    5. За две случајне променљиве важи
      • Доказ:

Граничне теореме

  • Низ случајних променљивих :
    • строго конвергира (конвергира скоро свуда) ка ако
    • конвергира у вероватноћи ка ако је за свако
    • конвергира у расподели (слабо конвергира) ка ако у свакој тачки у којој је непрекидна
    • -конвергира ка за ако
      • За се каже да конвергира у средњем квадратном ка
  • Из строге конвергенције следи конвергенција у вероватноћи, из конвергенције у вероватноћи следи конвергенција у расподели, а из конвергенције такође следи конвергенција у вероватноћи.
  • Теорема 6.1: (теорема о непрекидности) Нека је низ случајних променљивих са карактеристичним функцијама и нека је случајна променљива са карактеристичном функцијом . Низ конвергира у расподели ка ако и само ако је за свако .
  • Теорема 6.2: (апроксимација биномне расподеле Пуасоновом) ако и ако онда
  • Теорема 6.3: (неједнакост Маркова) ако је ненегативна случајна променљива и постоји , онда за свако
  • Теорема 6.4: (неједнакост Чебишева) ако постоји , тада је за свако
    • Доказ: на основу неједнакости Маркова,
  • Теорема 6.5: (слаби закон великих бројева) Нека су независне случајне променљиве са истим очекивањем и са коначним варијансама за свако , где је позитивна константа. Тада низ аритметичких средина конвергира у вероватноћи ка .
  • Теорема 6.6: (Борелов строги закон великих бројева) Ако је број успеха у Бернулијевих експеримената са вероватноћом успеха . тада је
  • Теорема 6.7: (Коломогоровљев строги закон великих бројева)
    1. Ако су независне случајне променљиве са истом расподелом и очекивањем , тада важи
    2. Ако су независне случајне променљиве са истом расподелом и ако постоји такав да је , тада све променљиве имају очекивање
  • Теорема 6.8: (централна гранична теорема) Ако су независне, са истом расподелом, очекивањем и коначним варијансама , тада конвергира у расподели ка .
    • У пракси мора да важи .
  • Теорема 6.9: (апроксимација биномне расподеле нормалном, Моавр-Лапласова теорема) Ако је и тада конвергира у расподели ка
    • Доказ: следи из централне граничне теореме,
  • Апроксимација Пуасонове расподеле нормалном:

Статистика

Основни појмови

  • Популација: скуп елемената (паралела из вероватноће: скуп исхода)
  • Обележје: нумеричка особина елемената (паралела из вероватноће: случајна променљива)
  • Статистички експеримент (у пракси): регистровање вредности на неком (правом) подскупу скупа , који називамо узорак. На основу узорка доносимо закључке о расподели .
  • Случајни узорак димензије је скуп независних случајних променљивих са истом расподелом.
    • Реализовани узорак представља реализоване вредности случајних променљивих у посматраном експерименту.
  • Статистика је случајна променљива која зависи само од случајних променљивих из узорка, не и од непознатих параметара расподеле.
    • Њена расподела сме да зависи од ових параметара.
    • Реализована вредност статистике:

Оцене параметара

  • Обележје има расподелу која зависи од скупа параметара .
    • : скуп допустивих расподела
    • : фамилија расподела
    • Ако не знамо можемо да бирамо узорак и на основу њега оцењујемо .

Тачкаста оцена

  • Реализована вредност статистике
  • Карактеристике:
    1. је центрирана (непристрасна) ако је за свако .
    2. је асимптотски непристрасна ако .
    3. је стабилна (постојана) ако конвергира у вероватноћи ка .
    4. Ако су и две оцене истог параметра , је боља од ако је с тим што строга неједнакост важи за бар једно .
    5. Ако су и две оцене истог параметра , кажемо да је ефикасније од ако је с тим што строга неједнакост важи за бар једно .

Интервална оцена

  • Интервал поверења: је интервал који, за дат узорак обима из расподеле , садржи непознати параметар са вероватноћом .
    • Двострани интервал поверења:
    • Једнострани интервал поверења: или
    • и су статистике.
  • Студентова -расподела:
    • Гама функција:
    • За можемо апроксимирати са
    • Теорема 7.1: Ако су са непознатим и , нека је и , тада важи .
  • Хи квадрат расподела:
    • Теорема 7.2: Ако су , њихов збир има расподелу .
Процена непознатих параметара у интервалима поверења код .
Процена Двострани интервал Једнострани интервал
Процена непознатог Познато или
Непознато Процењујемо : ,
или
Процена непознатог Познато , квантили из или , квантили из
Непознато , квантили из или , квантили из