Tilastollinen tunnusluku

Wikipediasta
Siirry navigaatioon Siirry hakuun

Tilastollinen tunnusluku on otoksen muunnos reaaliluvuksi tai reaalilukujen muodostamaksi vektoriksi. Tunnusluvuksi kutsutaan sekä muunnoksen avulla muodostettua satunnaismuuttujaa että sen saamaa arvoa.[1] Matemaattisesti ilmaistuna tunnusluku on siis kuvaus , missä on otoksen koko ja on tunnusluvun ulottuvuus.

Käyttötarkoituksia

[muokkaa | muokkaa wikitekstiä]

Tunnusluvun tarkoituksena on tiivistää otoksen sisältämä informaatio havainnolliseen muotoon, tyypillisesti yhdeksi luvuksi[2]. Tunnuslukuja voidaan käyttää otoksen kuvailuun[3], mutta niille on muitakin käyttötarkoituksia. Muun muassa merkitsevyystestien testisuureet ja tuntemattomien parametrien estimointiin liittyvät estimaattorit ovat tunnuslukuja[4]. Tunnusluvun jakauman määrääminen on yksi tilastotieteen keskeisistä ongelmista[5].

Tavanomaisia tunnuslukuja

[muokkaa | muokkaa wikitekstiä]

Yleisimmin käytettyjä tunnuslukuja ovat aineiston sijaintia kuvaavat keskiluvut sekä aineiston vaihteluun liittyvät hajontaluvut[6]. Keskilukuja ovat esimerkiksi aritmeettinen keskiarvo ja mediaani. Hajontalukuihin lukeutuvat muun muassa minimi, maksimi, ala- ja yläkvartiili ja varianssi sekä sen neliöjuuri eli keskihajonta.[3]

Tyhjentävyys

[muokkaa | muokkaa wikitekstiä]

Tunnuslukua kutsutaan tyhjentäväksi, jos se sisältää kaiken otoksesta saatavan tiedon. Muodollisesti kyse on siitä, että otoksen yhteisjakauma ehdollistettuna kyseisellä tunnusluvulla ja jakauman parametreilla ei riipu ollenkaan parametreista. Mikäli tunnusluku on kaikista mahdollisista tyhjentävistä tunnusluvuista yksinkertaisin, se on minimaalisesti tyhjentävä. Esimerkiksi otos itsessään on aina tyhjentävä tunnusluku, mutta se ei lainkaan tiivistä otoksesta saatavaa tietoa, joskin joissakin tapauksissa se on silti myös minimaalisesti tyhjentävä tunnusluku. [7]

Graafinen esittäminen

[muokkaa | muokkaa wikitekstiä]

Tunnusluvuilla on usein olemassa jonkinlainen graafinen vastine, kuten niin sanottu viiksilaatikko[8].

Käytettäköön esimerkkinä 30 havainnon otosta, joka on saatu R-ohjelmalla simuloimalla havainnot eksponenttijakaumasta parametrin arvolla . Otoksen havainnot ovat (kolmen desimaalin tarkkuudella) 0.495, 0.121, 2.152, 2.562, 0.074, 1.362, 0.192, 0.042, 0.336, 2.641, 1.257, 2.000, 0.871, 0.517, 0.951, 0.093, 0.340, 0.688, 1.640, 0.443, 0.552, 0.929, 0.818, 2.327, 0.514, 2.092, 0.466, 0.612, 0.187 ja 0.507.

Otoksen minimi , alakvartiili , mediaani , yläkvartiili ja maksimi . Tällöin tunnuslukua vastaa alla oleva viiksilaatikko.

Viiksilaatikko simuloidun aineiston pohjalta.
Viiksilaatikko simuloidun aineiston pohjalta.
  1. Cox, D. R., Hinkley, D. V. (1979): Theoretical Statistics, 18. Chapman and Hall, London.
  2. Lindgren, B. W. (1975): Basic Ideas of Statistics, 88. Macmillan Publishing, New York.
  3. a b Moore, D. S., McCabe, G. P., Craig, B. A. (2009): Introduction to the Practice of Statistics, Sixth Edition, 30–44. W. H. Freeman and Company, New York.
  4. Fisz, M. (1967): Probability Theory and Mathematical Statistics, Third Edition, 425–499. Wiley, New York.
  5. Fisz, M. (1967): Probability Theory and Mathematical Statistics, Third Edition, 337. Wiley, New York.
  6. Lindgren, B. W. (1975): Basic Ideas of Statistics, 89. Macmillan Publishing, New York.
  7. DeGroot, M. H. (1986): Probability and Statistics, Second Edition, 357–367. Addison-Wesley Publishing, Reading.
  8. Moore, D. S., McCabe, G. P., Craig, B. A. (2009): Introduction to the Practice of Statistics, Sixth Edition, 6–22, 36–38. W. H. Freeman and Company, New York.