Kvartiil
See artikkel vajab toimetamist. (Oktoober 2007) |
Kvartiilid on kirjeldavas statistikas tunnuse väärtused variatsioonireal, mis jagavad variatsioonirea neljaks ligikaudu võrdseks osaks.
- Keskmine kvartiil ehk 2. kvartiil e. 50-protsentiil e 0,5 kvantiil ehk mediaan on tunnuse väärtus, millest suuremaid ja väiksemaid tunnuseid on variatsioonireas ligikaudu võrdselt.
- Alumine kvartiil e. 1. kvartiil e. 25-protsentiil ehk 0,25 kvantiil (lühendid LQ ja Q1) on tunnuse väärtus, millest väiksemaid või võrdseid tunnuseid on ligikaudu 25%
- Ülemine kvartiil e. 3. kvartiil e 75-protsentiil ehk 0,75 kvantiil (lühendid UQ ja Q3) on tunnuse väärtus, millest suuremaid või võrdseid tunnuseid on ligikaudu 25%
Ülemise ja alumise kvartiili vahele jääb 50% tunnuste väärtustest. Seda vahemikku nimetatakse kvartiilhaardeks.
Ülemist ja alumist kvartiili saab defineerida ka tõenäosuslikult – variatsioonirea 1. kvartiil on selline tunnuse väärtus x, millest väiksemate väärtuste esinemise tõenäosus variatsioonireas on kõige rohkem 1/4. 3. kvartiil on selline tunnuse väärtus x, millest väiksemate väärtuste esinemise tõenäosus on kõige rohkem 3/4.
Ülemise ja alumise kvartiili arvutamise meetodeid
[muuda | muuda lähteteksti]Kvartiilide arvutamiseks on kasutusel erinevaid meetodeid, mis annavad pisut erinevaid tulemusi. Eristatakse nn. klassikalisi meetodeid, mis on mõeldud ennekõike kvartiilide arvutamiseks, ja meetodeid, mis on mõeldud protsentiilide arvutamiseks, kusjuures 25-protsentiil, 50-protsentiil ja 75-protsentiil vastavad vastavalt 1., 2. ja 3. kvartiilile.
Klassikalised meetodid
[muuda | muuda lähteteksti]Tukey meetod
[muuda | muuda lähteteksti]Tukey meetod on John Tukey välja töötatud meetod, mille eesmärk oli teha kvartiilide leidmine võimalikult lihtsaks.
Selle meetodi järgi:
- järjestatakse variatsioonirea elemendid väärtuste kasvamise järjekorras;
- jagatakse variatsioonirida pooleks nii, et mõlemale poole jääb võrdne arv elemente (leitakse mediaan);
- kui variatsioonireas on paaritu arv elemente, lisatakse mediaanväärtus mõlemale poolele;
- leitakse mõlema poole mediaan.
Näiteks:
Variatsioonirida elementidega {1, 2, 3, 4, 5, 6, 7, 8} 1. mediaan jaotab rea pooleks: 1, 2, 3, 4, - 5, 6, 7, 8 – mediaan on 4,5 2. alumine kvartiil: 1, 2, - 3, 4 - alumine kvartiil on 2,5 3. ülemine kvartiil: 5, 6, - 7, 8 - ülemine kvartiil on 6,5
Valemina:
- Kui n on paaritu arv, siis LQ= (n+3)/4; UQ= (3n+1)/4;
- Kui n on paarisarv, siis LQ= (n+2)/4; UQ= (3n+2)/4
kus n on elementide arv variatsioonireas
Variatsioonirida elementidega {1, 2, 3, 4, 5, 6, 7, 8} n=8, mis on paarisarv. Järelikult LQ=(8+2)/4= 2,5 UQ=(3×8+2)/4= 6,5
Moore'i ja McCabe'i meetod
[muuda | muuda lähteteksti]Moore'i ja McCabe'i meetod on edasiarendus Tukey meetodist. Kui variatsioonireas on paaritu arv elemente, siis erinevalt Tukey meetodist ei lisata mediaanväärtust kummalegi poolele. Muul juhul on tulemus sama.
- Kui n on paaritu arv, siis LQ= (n+1)/4; UQ=(3n+3)/4
- Kui n on paarisarv, siis LQ= (n+2)/4; UQ=(3n+2)/4
kus n on elementide arv variatsioonireas
Mendenhalli ja Sincichi meetod
[muuda | muuda lähteteksti]Selle meetodiga leitakse alumine kvartiil valemiga L = (n+1)/4, kus n on elementide arv ja L näitab alumisele kvartiilile vastava elemendi järjekorranumbrit variatsioonireas. Tulemus ümardatakse lähima täisarvuni; kui väärtus jääb täpselt kahe täisarvu vahele, ümardatakse ülespoole. Ülemine kvartiil leitakse valemiga U = (3n+3)/4, kus n on elementide arv ja U näitab ülemise kvartiili järjekorranumbrit variatsioonireas. Tulemus ümardatakse lähima täisarvuni; kui väärtus jääb täpselt kahe täisarvu vahele, ümardatakse allapoole.
Näiteks:
Variatsioonirida elementidega {1, 2, 3, 4, 5, 6, 7, 8} 1. L= (8+1)/4= 2,25 -> L=2, alumine kvartiil on 2. element ehk 2 2. U= (3×8+3)/4= 6,75 -> L=7, ülemine kvartiil on 7. element ehk 7
Mendenhalli ja Sincichi 1. variatsioon
[muuda | muuda lähteteksti]Kasutusel on ka sama meetodi variatsioon, kus L ja Q väärtust ei ümardata, vaid leitakse lineaarse interpolatsiooni abil lähimate väärtuste vahele jääv sobiv väärtus. Näiteks kui L=2,25, siis leitakse teise (L täisosa) ja sellele järgneva (kolmanda) elemendi vahel väärtus, mis on 1/4 kaugusel (L väärtuse murdosa 0,25) 2. elemendi väärtusest. (Antud näites on 2. ja 3. elemendi vahel sobivas kohas 2,25)
Mendenhalli ja Sincichi 2. variatsioon
[muuda | muuda lähteteksti]Kasutusel on ka sama meetodi variatsioon, kus L=(n+1)/4, kus n on elementide arv ja L näitab alumisele kvartiilile vastava elemendi järjekorranumbrit variatsioonireas. Tulemus ümardatakse lähima täisarvuni; kui väärtus jääb täpselt kahe täisarvu vahele, ümardatakse ülespoole. Ülemine kvartiil leitakse valemiga U = (3n+2)/4, kus n on elementide arv ja U näitab ülemise kvartiili järjekorranumbrit variatsioonireas. Tulemus ümardatakse lähima täisarvuni; kui väärtus jääb täpselt kahe täisarvu vahele, ümardatakse allapoole.
Freundi ja Perlesi meetod
[muuda | muuda lähteteksti]See on vähekasutatud meetod, mille järgi L = (n+3)/4, kus n on elementide arv ja L-nda elemendi väärtus on alumine kvartiil. Kui L pole täisarv, kasutatakse väärtuse leidmiseks lineaarset interpolatsiooni. Ülemise kvartiili leidmisel U = (3n+1)/4, kus n on elementide arv ja U-nda elemendi väärtus on ülemine kvartiil. Kui U pole täisarv, kasutatakse väärtuse leidmiseks lineaarset interpolatsiooni.
Variatsioonirida elementidega {1, 2, 3, 4, 5, 6, 7, 8} 1. L=(8+3)/4= 2,75 alumine kvartiil on 2,75 2. U=(3×8+1)/4= 6,25 ülemine kvartiil on 6,25
Muud meetodid
[muuda | muuda lähteteksti]Muud meetodid sarnanevad muude protsentiilide arvutamise meetoditega, kus leitakse vastavalt 25-protsentiili alumise kvantiili ja 75-protsentiili ülemise kvantiili jaoks.
Kirjandust
[muuda | muuda lähteteksti]- Math Forum - ask Dr. Math. Defining Quartiles.
- Franklin, David. Calculating the Quartile (or why are my Quartile answers different?).
- Percentile Calculation Options in STATISTICA. StatSoft, Inc. (2004). STATISTICA Electronic Manual.