Poolade dataexempel och övning löst

4409
Abraham McLaughlin

De grupperade data är de som har klassificerats i kategorier eller klasser och tar deras frekvens som kriterium. Detta görs för att förenkla hanteringen av stora mängder data och fastställa dess trender..

När de väl är organiserade i dessa klasser efter deras frekvenser utgör data a frekvensfördelning, från vilken användbar information utvinns genom dess egenskaper.

Figur 1. Med grupperade data kan grafer konstrueras och statistiska parametrar som beskriver trender kan beräknas. Källa: Pixabay.

Här är ett enkelt exempel på grupperade data:

Antag att höjden på 100 kvinnliga studenter, utvalda från alla grundläggande fysik kurser vid ett universitet, mäts och följande resultat erhålls:

De erhållna resultaten delades in i 5 klasser, som visas i den vänstra kolumnen.

Den första klassen, mellan 155 och 159 cm, har 6 elever, den andra klassen 160 - 164 cm har 14 elever, den tredje klassen 165 till 169 cm har flest medlemmar: 47. Sedan fortsätter klassen 170-174 cm med 28 elever och slutligen 175-174 cm med endast 5.

Antalet medlemmar i varje klass är exakt antalet frekvens eller Absolut frecuency och när alla läggs till erhålls den totala informationen, som i detta exempel är 100.

Artikelindex

  • 1 Egenskaper för frekvensfördelningen
    • 1.1 Frekvens
    • 1.2 Gränser
    • 1.3 Gränser
    • 1.4 Amplitud
    • 1.5 Klassmärke
  • 2 Mått på central tendens och spridning för grupperade data
    • 2.1 Genomsnitt
    • 2.2 Median
    • 2.3 Mode
    • 2.4 Avvikelse och standardavvikelse
  • 3 Övningen löst
    • 3.1 Lösning a
    • 3.2 Lösning b
    • 3.3 Lösning d
  • 4 Referenser

Frekvensfördelningens egenskaper

Frekvens

Som vi har sett är frekvensen det antal gånger en bit data upprepas. Och för att underlätta beräkningarna av fördelningens egenskaper, såsom medelvärde och varians, definieras följande mängder:

-Kumulativa frekvensen: det erhålls genom att addera frekvensen för en klass med den tidigare ackumulerade frekvensen. Den första av alla frekvenser matchar intervallet i fråga och den sista är det totala antalet data.

-Relativ frekvens: beräknas genom att dela den absoluta frekvensen för varje klass med det totala antalet data. Och om du multiplicerar med 100 har du den relativa procentuella frekvensen.

-Kumulativ relativ frekvens: är summan av de relativa frekvenserna för varje klass med den tidigare ackumulerade. Den sista av de ackumulerade relativa frekvenserna måste vara lika med 1.

För vårt exempel ser frekvenserna ut så här:

Gränser

De extrema värdena för varje klass eller intervall kallas klassgränser. Som vi kan se har varje klass en lägre och en högre gräns. Till exempel har den första klassen i studien om höjder en nedre gräns på 155 cm och en högre gräns på 159 cm..

Detta exempel har gränser som är klart definierade, men det är möjligt att definiera öppna gränser: om du istället för att definiera de exakta värdena, säg "höjd mindre än 160 cm", "höjd mindre än 165 cm" och så vidare.

Gränser

Höjd är en kontinuerlig variabel, så det kan anses att den första klassen faktiskt börjar vid 154,5 cm, eftersom avrundning av detta värde till närmaste heltal ger 155 cm.

Denna klass täcker alla värden upp till 159,5 cm, för efter detta avrundas höjderna till 160,0 cm. En höjd på 159,7 cm tillhör redan följande klass.

De faktiska klassgränserna för detta exempel är i cm:

  • 154,5 - 159,5
  • 159,5 - 164,5
  • 164,5 - 169,5
  • 169,5 - 174,5
  • 174,5 - 179,5

Amplitud

Bredden på en klass erhålls genom att subtrahera gränserna. För det första intervallet i vårt exempel har vi 159,5 - 154,5 cm = 5 cm.

Läsaren kan verifiera att amplituden för övriga intervall i exemplet också är 5 cm. Det bör dock noteras att fördelningar kan konstrueras med intervall med olika amplitud.

Klassmärke

Det är mittpunkten för intervallet och erhålls av medelvärdet mellan den övre gränsen och den nedre gränsen.

För vårt exempel är det första klassmärket (155 + 159) / 2 = 157 cm. Läsaren kan se att de återstående klassmärkena är: 162, 167, 172 och 177 cm.

Det är viktigt att bestämma klassmärken, eftersom de är nödvändiga för att hitta det aritmetiska medelvärdet och variansen för fördelningen.

Mått för central tendens och spridning för samlade data

De vanligaste måtten på central tendens är medelvärdet, medianen och läget, och de beskriver exakt tendensen hos data att klustera runt ett visst centralt värde..

Halv

Det är ett av de viktigaste måtten på central tendens. I grupperade data kan det aritmetiska medelvärdet beräknas med formeln:

-X är medelvärdet

-Fi är klassens frekvens

-mi är klassmärket

-g är antalet klasser

-n är det totala antalet data

Median

För medianen är det nödvändigt att identifiera intervallet där observationen n / 2 finns. I vårt exempel är denna observation nummer 50, eftersom det finns totalt 100 datapunkter. Denna observation ligger i intervallet 165-169 cm.

Då måste du interpolera för att hitta det numeriska värdet som motsvarar den observationen, för vilken formeln används:

Var:

-c = bredden på intervallet där medianen finns

-BM = den nedre gränsen för det intervall som medianen tillhör

-Fm = antal observationer som ingår i medianintervallet

-n / 2 = hälften av totala data

-FBM = totalt antal observationer innan medianintervall

mode

För läget identifieras modalklassen, den som innehåller flest observationer, vars klassmärke är känt.

Varians och standardavvikelse

Variansen och standardavvikelsen är mått på spridning. Om vi ​​betecknar variansen med stvå och standardavvikelsen, som är kvadratroten av variansen som s, för grupperade data har vi respektive:

Y

Övningen löst

Beräkna värdena för höjdfördelningen av kvinnliga universitetsstudenter i början:

a) Genomsnitt

b) Median

c) Mode

d) Avvikelse och standardavvikelse.

Figur 2. När man arbetar med ett stort antal värden, såsom höjderna för en stor grupp elever, är det att föredra att gruppera data i klasser. Källa: Pixabay.

Lösning till

Låt oss bygga följande tabell för att underlätta beräkningarna:

Ersätta värden och genomföra summeringen direkt:

X = (6 x 157 + 14 x 162 + 47 x 167 + 28 x 172+ 5 x 177) / 100 cm =

= 167,6 cm

Lösning b

Intervallet som medianen tillhör är 165-169 cm eftersom det är intervallet med den högsta frekvensen.

Låt oss identifiera var och en av dessa värden i exemplet med hjälp av tabell 2:

c = 5 cm (se amplitudavsnittet)

BM = 164,5 cm

Fm = 47

n / 2 = 100/2 = 50

FBM = 20

Ersätter i formeln:

Intervallet som innehåller de flesta observationerna är 165-169 cm, vars klassmärke är 167 cm.

Lösning d

Vi utvidgar föregående tabell genom att lägga till ytterligare två kolumner:

Vi tillämpar formeln:

Och vi utvecklar summeringen:

stvå = (6 x 112,36 + 14 x 31,36 + 47 x 0,36 + 28 x 19,36 + 5 x 88,36) / 99 = = 21,35 cmtvå

Därför:

s = √21,35 cmtvå = 4,6 cm

Referenser

  1. Berenson, M. 1985. Statistik för management och ekonomi. Interamericana S.A.
  2. Canavos, G. 1988. Sannolikhet och statistik: Tillämpningar och metoder. Mcgraw hill.
  3. Devore, J. 2012. Sannolikhet och statistik för teknik och vetenskap. 8: e. Utgåva. Cengage.
  4. Levin, R. 1988. Statistik för administratörer. 2: a. Utgåva. Prentice hall.
  5. Spiegel, M. 2009. Statistik. Schaum-serien. 4: e Utgåva. Mcgraw hill.
  6. Walpole, R. 2007. Sannolikhet och statistik för teknik och vetenskap. Pearson.

Ingen har kommenterat den här artikeln än.