Praktikspørgsmål: Beskrivende statistik

Har fået et spørgsmål vedrørende summeret frekvens (også kaldet kumuleret frekvens). Spørgsmålet går på, hvorfor man bruger summeret frekvens. Selvom det først er i et senere modul, at I kommer til at arbejde med statistik, så svarer jeg alligevel lige her. Ved at flere af jer arbejder med dette stofområde. Jeg går ikke i dybden her.

Beskrivende statistik

Overordnet, så kan man sige, at formålet med deskriptiv statistik (beskrivende statistik) er at beskrive og få overblik over en række observationer. Her kan man bruge diverse deskriptorer, tabeller og diagrammer. Man har enten diskrete data (enkeltobservationer) eller kontinuerte/grupperede data (grupperede observationer).

Et eksempel (diskrete data)

Lad os sige, at vi laver en række terningekast (diskrete data) og får følgende observationer:

4 1 1 2 5 5 1 4
5 4 2 4 6 2 6 4
3 6 4 6 6 4 5 4
6 3 5 6 5 1 1 3
2 2 1 5 2 2 4 2
4 1 2 4 3 3 1 6
1 2 6 2 5 4 3 5
2 6 6 6 1 5 4 2
1 3 6 6 6 4 1 4
2 4 1 4 2 2 3 3
4 6 6 2 3 6 5 1
1 6 1 5 2 3 2 1
2 2 2 1 3 4 2 1
4 6 6 4 4 5 3 3

Det er ret uoverskueligt at skulle sige noget om disse data i tabellen. Derfor kan vi vælge at fokusere på karakterers hyppighed og lave en såkaldt hyppighedstabel:

x h(x) H(x) f(x) F(x)
1 19 19 16,96% 0,169643
2 23 42 20,54% 37,50%
3 14 56 12,50% 50,00%
4 22 78 19,64% 69,64%
5 13 91 11,61% 81,25%
6 21 112 18,75% 100,00%

 

På den måde koger vi de 112 observationer ned og det bliver lettere at sige noget om, hvordan observationerne fordeler sig procentmæssigt/brøkmæssigt (også kaldet frekvens). Vi kan fx se, at 16,96% af de 112 kast er 1’ere, 20,54% er 2’ere osv.

Vi kan derefter anvende deskriptorer til at beskrive talmaterialet med. Her kan vi anvende de centrale deskriptorer: median, middeltal og typetal.

Hvis man ikke er så interesseret i de centrale tendenser i observationssættet, som man får ved at anvende de centrale deskriptorer, så kan man se på kvartilerne. Man kan finde fx 10-percentilen, 90-percentilen eller andre. Men 25-percentilen og 75-percentilen er så udbredte, at de kaldes hhv. nedre kvartil og øvre kvartil.

Svaret

Og nu kommer svaret på, hvorfor man anvender den summerede/kumulerede frekvens og hyppighed. Generelt kan disse bruges til at sige noget om, hvordan observationerne fordeler sig (frekvensmæssigt/hyppighedsmæssigt) op til en bestemt observation. Fx kan vi se, at 50% af ovenstående terningkast fordeler sig på tallene 1-3. Det var som forventet. Men vi kan også se, at tallene alligevel ikke helt fordeler sig som forventet, idet de 37,5% fordeler sig på tallene 1-2. Det burde reelt kun være 33,3%. Så en større del af tallene end forventet har været 1’ere og 2’ere.

Den kumulerede hyppighed siger i samme stil noget om, hvor mange observationer der er op til en bestemt observation. Fx kan vi se, at 42 observationer er 2’ere eller mindre, 78 er 4’ere eller mindre osv.

 

Håber, at det giver mening.

Subscribe
Notify of
guest

0 Comments
Oldest
Newest Most Voted
Inline Feedbacks
View all comments