Hemsida
Statistik
Icke-grupperade dataexempel och övning löst

Icke-grupperade dataexempel och övning löst

2646

366

Egbert Haynes

De ogrupperade data är de som, erhållna från en studie, ännu inte är organiserade av klasser. När det är ett hanterbart antal data, vanligtvis 20 eller mindre, och det finns få olika data, kan det behandlas som icke-grupperad och värdefull information extraherad från den.

De icke-grupperade uppgifterna kommer som det är från undersökningen eller studien som genomförts för att få dem och saknar därför bearbetning. Låt oss titta på några exempel:

Figur 1. De icke-grupperade uppgifterna kommer direkt från någon studie och har inte klassificerats. Källa: Pxhere.

-Resultat av ett IQ-test på 20 slumpmässiga studenter från ett universitet. De erhållna uppgifterna var följande:

119, 109, 124, 119, 106, 112, 112, 112, 112, 109, 112, 124, 109, 109, 109, 106, 124, 112, 112.106

-Åldrar på 20 anställda i en viss populär kafé:

24, 20, 22, 19, 18, 27, 25, 19, 27, 18, 21, 22, 23, 21, 19, 22, 27, 29, 23, 20

-Slutbetyget på 10 studenter i en matematikklass:

3,2; 3.1; 2,4; 4,0; 3,5; 3,0; 3,5; 3,8; 4,2; 4.9

Artikelindex

1 Dataegenskaper
2 Beräkning av medelvärde, median och läge
3 Område, varians, standardavvikelse och förspänning
- 3.1 Avvikelse och standardavvikelse
4 Övningen löst
- 4.1 Lösning
5 Referenser

Dataegenskaper

Det finns tre viktiga egenskaper som kännetecknar en uppsättning statistiska data, oavsett om de är grupperade eller inte, vilka är:

-Placera, vilket är datans tendens att kluster runt vissa värden.

-Dispersion, en indikation på hur utspridda eller spridda uppgifterna är kring ett givet värde.

-Form, Det hänvisar till det sätt på vilket data distribueras, vilket uppskattas när en graf av samma konstrueras. Det finns mycket symmetriska kurvor och också skeva, antingen till vänster eller till höger om ett visst centralt värde.

För var och en av dessa egenskaper finns det en serie åtgärder som beskriver dem. När de väl erhållits ger de oss en översikt över uppförandet av uppgifterna:

-De mest använda positionsmåtten är det aritmetiska medelvärdet eller helt enkelt medelvärdet, medianen och läget.

-Räckvidd, varians och standardavvikelse används ofta i dispersion, men de är inte de enda måtten på dispersion..

-Och för att bestämma formen jämförs medelvärdet och medianen genom bias, som du kommer att se inom kort.

Beräkning av medelvärde, median och läge

-Det aritmetiska medelvärdet, även känd som genomsnitt och betecknad som X, beräknas den enligt följande:

X = (x₁ + x_två + x₃ +... X_n) / n

Där x₁, x_två,.... x_n, är data och n är summan av dem. I summeringsnotation har vi:

-Median är det värde som visas mitt i en ordnad sekvens av data, så för att få det är det nödvändigt att beställa data först och främst.

Om antalet observationer är udda finns det inget problem att hitta mittpunkten för uppsättningen, men om vi har ett jämnt antal data söks och medelvärdes de två centrala data.

-Mode är det vanligaste värdet som observerats i datamängden. Det finns inte alltid, eftersom det är möjligt att inget värde upprepas oftare än ett annat. Det kan också finnas två data med samma frekvens, i vilket fall vi talar om en bi-modal fördelning.

Till skillnad från de två föregående måtten kan läget användas med kvalitativa data.

Låt oss se hur dessa positionsmått beräknas med ett exempel:

Fungerat exempel

Antag att vi vill bestämma det aritmetiska medelvärdet, medianen och läget i exemplet som föreslogs i början: åldrarna 20 anställda i en cafeteria:

24, 20, 22, 19, 18, 27, 25, 19, 27, 18, 21, 22, 23, 21, 19, 22, 27, 29, 23, 20

De halv det beräknas helt enkelt genom att lägga till alla värden och dela med n = 20, vilket är det totala antalet data. På det här sättet:

X = (24 + 20 + 22 + 19 + 18 + 27+ 25 + 19 + 27 + 18 + 21 + 22 + 23 + 21+ 19 + 22 + 27+ 29 + 23+ 20) / 20 =

= 22,3 år.

För att hitta median du måste sortera datamängden först:

18, 18, 19, 19, 19, 20, 20, 21, 21, 22, 22, 22, 23, 23, 24, 25, 27, 27, 27, 29

Eftersom det är ett jämnt antal data tas de två centrala data, markerade med fet stil, och medelvärdet. Eftersom de båda är 22 är medianen 22 år.

Slutligen, mode Det är data som upprepas mest eller den vars frekvens är större, det här är 22 år.

Område, varians, standardavvikelse och förspänning

Området är helt enkelt skillnaden mellan den största och den minsta av data och gör att du snabbt kan uppskatta variationen i data. Men förutom det finns andra mått på spridning som ger mer information om distributionen av data..

Varians och standardavvikelse

Variansen betecknas som s och beräknas med uttrycket:

Så för att korrekt tolka resultaten definieras standardavvikelsen som kvadratroten av variansen, eller också kvasistandardavvikelsen, som är kvadratroten av kvasivariansen:

Det är jämförelsen mellan medelvärdet X och medianmedlet:

-Om Med = betyder X: data är symmetriska.

-När X> Med: snedställ åt höger.

-Och om X < Med: los datos sesgan hacia la izquierda.

Övningen löst

Hitta medelvärde, median, läge, intervall, varians, standardavvikelse och bias för resultaten av ett IQ-test utfört på 20 studenter från ett universitet:

119, 109, 124, 119, 106, 112, 112, 112, 112, 109, 112, 124, 109, 109, 109, 106, 124, 112, 112, 106

Lösning

Vi kommer att beställa data, eftersom det kommer att vara nödvändigt att hitta medianen.

106, 106, 106, 109, 109, 109, 109, 109, 112, 112, 112, 112, 112, 112, 112, 119, 119, 124, 124, 124

Och vi kommer att lägga dem i en tabell enligt följande för att underlätta beräkningarna. Den andra kolumnen med titeln "Ackumulerad" är summan av motsvarande data plus den tidigare..

Den här kolumnen hjälper till att enkelt hitta medelvärdet genom att dela det senaste ackumulerade med det totala antalet data, vilket ses i slutet av kolumnen "Ackumulerad":

X = 112,9

Medianen är medelvärdet av de centrala data som markeras i rött: siffran 10 och siffran 11. Eftersom de är desamma är medianen 112.

Slutligen är läget det värde som upprepas mest och är 112, med 7 repetitioner..

När det gäller måtten på spridning är intervallet:

124-106 = 18.

Variansen erhålls genom att dela slutresultatet i höger kolumn med n:

s = 668,6 / 20 = 33,42

I detta fall är standardavvikelsen kvadratroten av variansen: √33,42 = 5,8.

Å andra sidan är värdena på kvasi-variansen och kvasi-standardavvikelsen:

s_c= 668,6 / 19 = 35,2

Kvasi-standardavvikelse = √35.2 = 5.9

Slutligen är förspänningen något åt höger, eftersom medelvärdet 112,9 är större än medianvärdet 112.

Referenser

Berenson, M. 1985. Statistik för management och ekonomi. Interamericana S.A.
Canavos, G. 1988. Sannolikhet och statistik: Tillämpningar och metoder. Mcgraw hill.
Devore, J. 2012. Sannolikhet och statistik för teknik och vetenskap. 8: e. Utgåva. Cengage.
Levin, R. 1988. Statistik för administratörer. 2: a. Utgåva. Prentice hall.
Walpole, R. 2007. Sannolikhet och statistik för teknik och vetenskap. Pearson.