Hemsida
Statistik
Grader av frihet hur man beräknar dem, typer, exempel

Grader av frihet hur man beräknar dem, typer, exempel

1427

Egbert Haynes

De grader av frihet i statistik är de antalet oberoende komponenter i en slumpmässig vektor. Om vektorn har n komponenter och det finns sid linjära ekvationer som relaterar deras komponenter, sedan grad av frihet är n-p.

Konceptet av grader av frihet Det förekommer också i teoretisk mekanik, där de ungefär motsvarar dimensionen i rymden där partikeln rör sig, minus antalet bindningar..

Figur 1. En pendel rör sig i två dimensioner, men den har bara en frihetsgrad eftersom den tvingas röra sig i en båge med radie L. Källa: F. Zapata.

Denna artikel kommer att diskutera begreppet frihetsgrader som tillämpas på statistik, men ett mekaniskt exempel är lättare att visualisera i geometrisk form.

Artikelindex

1 Typer av frihetsgrader
- 1.1 I ett mekaniskt fall
- 1.2 I en uppsättning slumpmässiga värden
2 Exempel
- 2.1 Varians och frihetsgrader
- 2.2 I Chi-kvadratfördelningen
- 2.3 I hypotesprovning (med utarbetat exempel)
3 Referenser

Typer av frihetsgrader

Beroende på i vilket sammanhang det tillämpas kan sättet att beräkna antalet frihetsgrader variera, men den underliggande idén är alltid densamma: totala dimensioner minus antal begränsningar.

I ett mekaniskt fall

Låt oss överväga en oscillerande partikel bunden till en sträng (en pendel) som rör sig i det vertikala x-y-planet (2 dimensioner). Partikeln tvingas emellertid att röra sig på radiens omkrets lika med ackordets längd.

Eftersom partikeln bara kan röra sig på den kurvan, är antalet grader av frihet är 1. Detta kan ses i figur 1.

Sättet att beräkna antalet frihetsgrader är genom att ta skillnaden mellan antalet dimensioner minus antalet begränsningar:

frihetsgrader: = 2 (dimensioner) - 1 (ligatur) = 1

En annan förklaring som låter oss nå fram till resultatet är följande:

-Vi vet att positionen i två dimensioner representeras av en koordinatpunkt (x, y).

-Men eftersom punkten måste uppfylla ekvationen för omkretsen (x^två + Y^två = L^två) för ett givet värde av variabeln x bestäms variabeln y av nämnda ekvation eller begränsning.

Således är endast en av variablerna oberoende och systemet har en (1) grad av frihet.

I en uppsättning slumpmässiga värden

Antag vektorn för att illustrera vad konceptet betyder

x = (x₁, x_två,..., x_n)

Vad representerar urvalet av n normalt fördelade slumpmässiga värden. I detta fall den slumpmässiga vektorn x ha n oberoende komponenter och därför sägs det x ha n grader av frihet.

Låt oss nu bygga vektorn r av avfall

r = (x₁ - , x_två - ,...., X_n - )

Var representerar provmedelvärdet, vilket beräknas enligt följande:

= (x₁ + x_två +…. + X_n) / n

Så summan

(x₁ - ) + (x_två - ) + .... + (X_n - ) = (x₁ + x_två +…. + X_n) - n= 0

Det är en ekvation som representerar en begränsning (eller bindning) för elementen i vektorn r av resterna, eftersom om n-1-komponenter i vektorn är kända r, begränsningsekvationen bestämmer den okända komponenten.

Därför vektorn r av dimension n med begränsningen:

∑ (x_i - ) = 0

Ha (n - 1) frihetsgrader.

Återigen tillämpas att beräkningen av antalet frihetsgrader är:

frihetsgrader: = n (dimensioner) - 1 (begränsningar) = n-1

Exempel

Varians och frihetsgrader

Variansen s^två definieras som medelvärdet av kvadraten för avvikelserna (eller resterna) av urvalet av n-data:

s^två = (r•r) / (n-1)

var r är vektorn för resterna r = (x1 - , x2 - ,...., Xn - ) och den tjocka punkten (•) är den skalära produktoperatören. Alternativt kan variansformeln skrivas enligt följande:

s^två = ∑ (x_i - )^två / (n-1)

I vilket fall som helst bör det noteras att vid beräkning av medelvärdet av resterna delas det av (n-1) och inte av n, eftersom som diskuterats i föregående avsnitt, antalet frihetsgrader för vektor r är (n-1).

Om för beräkningen av variansen dividerades med n istället för (n-1) skulle resultatet ha en bias som är mycket signifikant för värdena på n under 50.

I litteraturen visas variansformeln också med delaren n istället för (n-1), när det gäller variationen hos en population.

Men uppsättningen av den slumpmässiga variabeln för resterna, representerad av vektorn r, Även om den har dimension n har den bara (n-1) frihetsgrader. Men om antalet data är tillräckligt stort (n> 500) konvergerar båda formlerna till samma resultat.

Miniräknare och kalkylark ger båda versionerna av variansen och standardavvikelsen (som är kvadratroten av variansen).

Vår rekommendation, med tanke på analysen som presenteras här, är att alltid välja version med (n-1) varje gång det krävs att beräkna varians eller standardavvikelse för att undvika partiska resultat..

I Chi-kvadratfördelningen

Vissa sannolikhetsfördelningar i kontinuerlig slumpmässig variabel beror på en parameter som kallas grad av frihet, är fallet med Chi-kvadratfördelningen (χ^två).

Namnet på denna parameter kommer exakt från frihetsgraderna för den underliggande slumpmässiga vektorn som denna fördelning gäller.

Antag att vi har gpopulationer, från vilka prover av storlek n tas:

X₁ = (x1₁, x1_två,... X1_n)

X2 = (x2₁, x2_två,... X2_n)

... .

X_j = (xj₁, xj_två,... Xj_n)

... .

Xg = (xg₁, xg_två,... Xg_n)

En befolkning j vad har genomsnittet och standardavvikelse Sj, följer normalfördelningen N (, Sj ).

Den standardiserade eller normaliserade variabeln zj_i är definierad som:

zj_i = (xj_i - ) / Sj.

Och vektorn Zj definieras så här:

Zj = (zj₁, zj_två,..., zj_i,..., zj_n) och följer den standardiserade normalfördelningen N (0,1).

Så variabeln:

F = ((z1₁^ 2 + z2₁^ 2 +…. + zg₁^ 2),…., (Z1_n^ 2 + z2_n^ 2 +…. + zg_n^ 2))

följ distributionen χ^två(g) kallade chi fyrkantig fördelning med grad av frihet g.

I hypotesprovet (med utarbetat exempel)

När du vill testa hypoteser baserade på en viss uppsättning slumpmässiga data måste du känna till antal frihetsgrader g för att kunna tillämpa Chi kvadrat testet.

Figur 2. Finns det ett samband mellan preferensen för glass FLAVOR och kundens KÖN? Källa: F. Zapata.

Som ett exempel kommer de uppgifter som samlats in om choklad- eller jordgubbglassens preferenser bland män och kvinnor i en viss glassbar. Frekvensen med vilken män och kvinnor väljer jordgubbe eller choklad sammanfattas i figur 2.

Först beräknas tabellen över förväntade frekvenser, som bereds genom att multiplicera totalt antal rader för honom totalt kolumner, delat med totala data. Resultatet visas i följande bild:

Figur 3. Beräkning av förväntade frekvenser baserat på de observerade frekvenserna (värden i blått i figur 2). Källa: F. Zapata.

Sedan fortsätter vi med att beräkna Chi-kvadraten (från data) med följande formel:

χ^två = ∑ (F_eller - F_och)^två / F_och

Där F_eller är de observerade frekvenserna (Figur 2) och F_och är de förväntade frekvenserna (figur 3). Summationen går över alla rader och kolumner, vilket i vårt exempel ger fyra termer.

Efter att ha gjort operationerna får du:

χ^två = 0,2043.

Nu är det nödvändigt att jämföra med den teoretiska Chi-kvadraten, som beror på antal frihetsgrader g.

I vårt fall bestäms detta antal enligt följande:

g = (# rader - 1) (# kolumner - 1) = (2 - 1) (2 - 1) = 1 * 1 = 1.

Det visar sig att antalet frihetsgrader g i detta exempel är 1.

Om du vill kontrollera eller avvisa nollhypotesen (H0: det finns ingen korrelation mellan SMAK och KÖN) med en signifikansnivå på 1% beräknas det teoretiska Chi-kvadratvärdet med frihetsgraden g = 1.

Värdet söks som gör den ackumulerade frekvensen (1 - 0.01) = 0.99, det vill säga 99%. Detta värde (som kan erhållas från tabellerna) är 6.636.

Eftersom den teoretiska Chi överstiger den beräknade, verifieras nollhypotesen.

Det vill säga med de insamlade uppgifterna, Inte observerat förhållandet mellan variablerna TASTE och KÖN.

Referenser

Minitab. Vilka är frihetsgraderna? Återställd från: support.minitab.com.
Moore, David. (2009) Grundläggande tillämpad statistik. Antoni Bosch redaktör.
Leigh, Jennifer. Hur man beräknar frihetsgrader i statistiska modeller. Återställd från: geniolandia.com
Wikipedia. Grad av frihet (statistik). Återställd från: es.wikipedia.com
Wikipedia. Grad av frihet (fysisk). Återställd från: es.wikipedia.com