Tilastollinen tunnusluku

Tilastollinen tunnusluku on otoksen muunnos reaaliluvuksi tai reaalilukujen muodostamaksi vektoriksi. Tunnusluvuksi kutsutaan sekä muunnoksen avulla muodostettua satunnaismuuttujaa että sen saamaa arvoa.^[1] Matemaattisesti ilmaistuna tunnusluku on siis kuvaus $\mathbb {R} ^{N}\rightarrow \mathbb {R} ^{M}$ , missä $N\in \mathbb {N}$ on otoksen koko ja $M\in \mathbb {N}$ on tunnusluvun ulottuvuus.

Käyttötarkoituksia

Tunnusluvun tarkoituksena on tiivistää otoksen sisältämä informaatio havainnolliseen muotoon, tyypillisesti yhdeksi luvuksi^[2]. Tunnuslukuja voidaan käyttää otoksen kuvailuun^[3], mutta niille on muitakin käyttötarkoituksia. Muun muassa merkitsevyystestien testisuureet ja tuntemattomien parametrien estimointiin liittyvät estimaattorit ovat tunnuslukuja^[4]. Tunnusluvun jakauman määrääminen on yksi tilastotieteen keskeisistä ongelmista^[5].

Tavanomaisia tunnuslukuja

Yleisimmin käytettyjä tunnuslukuja ovat aineiston sijaintia kuvaavat keskiluvut sekä aineiston vaihteluun liittyvät hajontaluvut^[6]. Keskilukuja ovat esimerkiksi aritmeettinen keskiarvo ja mediaani. Hajontalukuihin lukeutuvat muun muassa minimi, maksimi, ala- ja yläkvartiili ja varianssi sekä sen neliöjuuri eli keskihajonta.^[3]

Tyhjentävyys

Tunnuslukua kutsutaan tyhjentäväksi, jos se sisältää kaiken otoksesta saatavan tiedon. Muodollisesti kyse on siitä, että otoksen yhteisjakauma ehdollistettuna kyseisellä tunnusluvulla ja jakauman parametreilla ei riipu ollenkaan parametreista. Mikäli tunnusluku on kaikista mahdollisista tyhjentävistä tunnusluvuista yksinkertaisin, se on minimaalisesti tyhjentävä. Esimerkiksi otos itsessään on aina tyhjentävä tunnusluku, mutta se ei lainkaan tiivistä otoksesta saatavaa tietoa, joskin joissakin tapauksissa se on silti myös minimaalisesti tyhjentävä tunnusluku. ^[7]

Graafinen esittäminen

Tunnusluvuilla on usein olemassa jonkinlainen graafinen vastine, kuten niin sanottu viiksilaatikko^[8].

Käytettäköön esimerkkinä 30 havainnon otosta, joka on saatu R-ohjelmalla simuloimalla havainnot eksponenttijakaumasta parametrin arvolla $\lambda =1$ . Otoksen havainnot ovat (kolmen desimaalin tarkkuudella) 0.495, 0.121, 2.152, 2.562, 0.074, 1.362, 0.192, 0.042, 0.336, 2.641, 1.257, 2.000, 0.871, 0.517, 0.951, 0.093, 0.340, 0.688, 1.640, 0.443, 0.552, 0.929, 0.818, 2.327, 0.514, 2.092, 0.466, 0.612, 0.187 ja 0.507.

Otoksen minimi $Min=0.042$ , alakvartiili $Q_{1}=0.367$ , mediaani $M=0.582$ , yläkvartiili $Q_{3}=1.336$ ja maksimi $Max=2.641$ . Tällöin tunnuslukua $(Min,Q_{1},M,Q_{3},Max)$ vastaa alla oleva viiksilaatikko.

Viiksilaatikko simuloidun aineiston pohjalta.

Lähteet

↑ Cox, D. R., Hinkley, D. V. (1979): Theoretical Statistics, 18. Chapman and Hall, London.
↑ Lindgren, B. W. (1975): Basic Ideas of Statistics, 88. Macmillan Publishing, New York.
↑ ^a ^b Moore, D. S., McCabe, G. P., Craig, B. A. (2009): Introduction to the Practice of Statistics, Sixth Edition, 30–44. W. H. Freeman and Company, New York.
↑ Fisz, M. (1967): Probability Theory and Mathematical Statistics, Third Edition, 425–499. Wiley, New York.
↑ Fisz, M. (1967): Probability Theory and Mathematical Statistics, Third Edition, 337. Wiley, New York.
↑ Lindgren, B. W. (1975): Basic Ideas of Statistics, 89. Macmillan Publishing, New York.
↑ DeGroot, M. H. (1986): Probability and Statistics, Second Edition, 357–367. Addison-Wesley Publishing, Reading.
↑ Moore, D. S., McCabe, G. P., Craig, B. A. (2009): Introduction to the Practice of Statistics, Sixth Edition, 6–22, 36–38. W. H. Freeman and Company, New York.

[1] Cox, D. R., Hinkley, D. V. (1979): Theoretical Statistics, 18. Chapman and Hall, London.

[2] Lindgren, B. W. (1975): Basic Ideas of Statistics, 88. Macmillan Publishing, New York.

[Nimetön-rG6n-1-3] Moore, D. S., McCabe, G. P., Craig, B. A. (2009): Introduction to the Practice of Statistics, Sixth Edition, 30–44. W. H. Freeman and Company, New York.

[4] Fisz, M. (1967): Probability Theory and Mathematical Statistics, Third Edition, 425–499. Wiley, New York.

[5] Fisz, M. (1967): Probability Theory and Mathematical Statistics, Third Edition, 337. Wiley, New York.

[6] Lindgren, B. W. (1975): Basic Ideas of Statistics, 89. Macmillan Publishing, New York.

[7] DeGroot, M. H. (1986): Probability and Statistics, Second Edition, 357–367. Addison-Wesley Publishing, Reading.

[8] Moore, D. S., McCabe, G. P., Craig, B. A. (2009): Introduction to the Practice of Statistics, Sixth Edition, 6–22, 36–38. W. H. Freeman and Company, New York.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

Tilastollinen tunnusluku

Sisällys

Käyttötarkoituksia

Tavanomaisia tunnuslukuja

Tyhjentävyys

Graafinen esittäminen

Lähteet

Navigointivalikko

Tilastollinen tunnusluku

Käyttötarkoituksia

Tavanomaisia tunnuslukuja

Tyhjentävyys

Graafinen esittäminen

Lähteet

Navigointivalikko

Haku