APUNAP32 Zpracování dat a statistika

Fyzikální ústav v Opavě
zima 2021
Rozsah
2/2/0. 6 kr. Ukončení: zk.
Vyučující
doc. RNDr. Stanislav Hledík, Ph.D. (přednášející)
Garance
doc. RNDr. Stanislav Hledík, Ph.D.
Fyzikální ústav v Opavě
Předpoklady
(FAKULTA(FU) && TYP_STUDIA(B))
Omezení zápisu do předmětu
Předmět je nabízen i studentům mimo mateřské obory.
Mateřské obory/plány
Cíle předmětu
Předmět seznamuje posluchače se základy počtu pravděpodobnosti, se základy popisné i inferenční statistiky včetně prezentace statistických dat, a se základy modelování dat. Výklad je doplněn interaktivními počítačovými demonstracemi založenými na reálných datech a případech.
Výstupy z učení
Student bude po absolvování předmětu:
- ovládat standardní statistické metody v rozsahu nezbytném pro danou specializaci;
- umět interpretovat získaná data;
- umět korektně designovat experiment;
- schopen skeptického uvažování a kritického hodnocení
Osnova
  • 1. Základní pojmy teorie pravděpodobnosti. Opakování, kombinatorika. Pojem pravděpodobnosti, náhodný pokus, náhodný jev, definice a vlastnosti pravděpodobnosti. Nezávislost jevů, podmíněná pravděpodobnost. Náhodná veličina diskrétní a spojitá, pravděpodobnostní distribuční funkce (hustota pravděpodobnosti, PDF) a (kumulativní) distribuční funkce (CDF).

    2. Charakteristiky rozdělení pravděpodobnosti. Momenty, střední hodnota, rozptyl, standardní odchylka, šikmost, kurtosita, další míry variability. Medián, kvantily, modus. Transformace náhodné veličiny.

    3. Základní jednorozměrné distribuční funkce. Diskrétní distribuční funkce. Spojité distribuční funkce.

    4. Náhodný vektor. Distribuční funkce a hustoty pravděpodobnosti vícerozměrných rozdělení. Marginální rozdělení, korelační (kontingenční) tabulka. Momenty rozdělení, kovariance, lineární korelační koeficient, nekorelované a nezávislé veličiny. Multinomické rozdělení, dvoudimenzionální normální rozdělení.

    5. Limitní věty počtu pravděpodobnosti. Bernoulliova věta, zákon velkých čísel (Čebyševova věta), centrální limitní teorém.

    6. Statistika – úvod a statistická šetření. Základní pojmy. Kvalitativní a kvantitativní proměnné a jejich statistické charakteristiky. Výběrová šetření, způsoby, typy a chyby. Výběrová rozdělení a jejich charakteristiky - populační vs. výběrové, četnosti. Rozdělení statistik ve výběrech z normálního rozdělení.

    7. Základy teorie odhadu. Bodový a intervalový odhad, nestranný a nejlepší nestranný odhad. Asymptotické vlastnosti odhadu, konzistentní odhad. Konstrukce bodového odhadu. Konstrukce intervalového odhadu.

    8. Testování statistických hypotéz. Metodika testování hypotéz, statistická hypotéza, nulová a alternatívní hypotéza, testová statistika, hladina statistické významnosti, p-hodnota, počet stupňů volnosti, chyba prvního a druhého druhu.

    9. Vybrané parametrické testy. Testování aritmetického průměru a rozptylu (Studentův t-test a F-test), testy dobré shody (chi kvadrát, K-S test). Analýza závislostí. Analýza rozptylu (ANOVA), post hoc analýza.

    10. Vybrané neparametrické testy. Mannův-Whitneyův test, Kruskalův-Wallisův test, Spearmanův koeficient, Kendallovo tau. Testy pro závislé výběry (Friedmanův test).

    11. Regresní a korelační analýza. Model, koeficienty modelu. Lineární regresní model. Bodové odhady (bodový odhad parametrů regresní přímky, význam bodových odhadů), verifikace modelu, stabilita modelu, testování reziduí. Zobecněná lineární regrese (konstrukční matice, normální rovnice, multikolinearita). Index determinace, parciální korelační koeficienty.

    12. Ukázky případových studií a aplikací metod statistiky a modelování dat.
Literatura
    povinná literatura
  • RICE, John A. Mathematical Statistics and Data Analysis (with CD Data Sets). 3 edition. Belmont, CA: Thomson/Brooks/Cole, 2007. ISBN 0-534-39942-8. info
    doporučená literatura
  • E.T. Jaynes. Probability Theory: The Logic of Science. Cambridge University Press (June 9, 2003). ISBN 978- 0521592710.
Výukové metody
přednášky; cvičení
Metody hodnocení
Aktivní účast na cvičení a vyřešení všech domácích úloh. Studenti v rámci ústní zkoušky prokazují znalosti a přehled z oblasti statistiky a zpracování dat v rozsahu přednášek.
Další komentáře
Studijní materiály
Předmět je vyučován každoročně.
Výuka probíhá každý týden.
Předmět je zařazen také v obdobích zima 2020, zima 2022, zima 2023, zima 2024.