Kategoriska variabla egenskaper och exempel

2310
Philip Kelley
Kategoriska variabla egenskaper och exempel

De kategorisk variabel Det är den som används i statistik för att tilldela en icke-numerisk eller kvalitativ egenskap eller egenskap till något objekt, individ, enhet, tillstånd eller procedur. Det är möjligt att definiera alla typer av kategoriska variabler efter varje behov. 

Exempel på kategoriska variabler är: färg, kön, blodgrupp, civilstånd, typ av material, betalningsform eller typ av bankkonto, och de används mycket dagligen..

Figur 1: Färg är en kategorisk variabel. Källa: Pixabay

Ovanstående är variablerna, men deras möjliga värden är kvalitativa, det vill säga av kvalitet eller karakteristik och inte av en numerisk mätning. Till exempel de möjliga värdena för variabeln sex Dom är: manlig , hembra.

När denna variabel lagras i ett datorprogram kan den deklareras som en textvariabel och de enda accepterade värdena är de som redan har nämnts: Manlig , Kvinna.

Men samma variabel sex kan deklareras och lagras som ett heltal om a Manlig tilldelas 1 redan Kvinna värdet tilldelas två. Det är av den anledningen som kategoriska variabler ibland kallas uppräknad typ.

Det huvudsakliga kännetecknet för kategoriska variabler är att till skillnad från andra variabler, såsom kontinuerlig och diskret, är det inte möjligt att göra aritmetik med dem. Du kan dock göra statistik med dem, vilket kommer att ses senare.

Artikelindex

  • 1 Exempel
  • 2 Klassificering av kategoriska variabler
    • 2.1 Nominella kategorier 
    • 2.2 Vanliga kategorier
    • 2.3 Binära kategorier
  • 3 Statistik med kategoriska variabler
    • 3.1 Grafisk representation av kategoriska variabler
  • 4 Lösta övningar
    • 4.1 Övning 1
    • 4.2 Exempel 2
    • 4.3 Exempel 3
  • 5 Referenser

Exempel

Notera följande exempel på kategoriska variabler och deras möjliga värden:

-Blod typ, Värdeområde: A, B, AB, O

-Civil status, Kategoriska värden: Enda (TILL), Gift (B), Änkling (C) , Skild (D).

-Typ av material, Kategorier eller värden: 1 = Trä, 2 = Metall, 3 = Plast

-Sätt att betala, Värden eller kategorier: (1) Kontanter, (2) Debet, (3) Överföring, (4) Kredit

I de föregående exemplen har ett nummer associerats med varje kategori på ett helt godtyckligt sätt. 

Man kan då tro att denna godtyckliga numeriska förening gör den lika med a diskret kvantitativ variabel, men det är det inte, eftersom aritmetiska operationer inte kan göras med dessa siffror.

För att illustrera idén, i variabeln Sätt att betala, summanövreringen är inte meningsfull:

 (1) Kontanter + (2) Debitering kommer aldrig att vara lika (3) Överföring

Klassificering av kategoriska variabler

Rangordningen baseras på huruvida de har en implicit hierarki eller om antalet möjliga resultat är mer än två eller två.

En kategorisk variabel med endast ett möjligt resultat är inte en variabel, den är en kategorisk konstant.

Nominella kategorier 

När de inte kan representeras av ett nummer eller ha någon ordning. Till exempel variabeln: Material_type, thar nominella värden (Trä, metall, plast), de har ingen hierarki eller ordning, även om ett godtyckligt nummer tilldelas varje svar eller kategori.

Ordinär kategorisk

Variabel: Studieresultat

Nominella värden: Hög, Medium, Låg

Även om värdena för denna variabel inte är numeriska, har de en implicit ordning eller hierarki.

Binära kategorier

Dessa är nominella variabler med två möjliga svar, till exempel:

-Variabel: Svar

-Nominella värden: Sann, Falsk

Observera att variabeln Svar det har ingen implicit hierarki och har bara två möjliga resultat, så det är en binär kategorisk variabel.

Vissa författare kallar den här typen binär variabel, och anser inte att det tillhör kategoriska variabler som är begränsade till de med mer än tre möjliga kategorier.

Statistik med kategoriska variabler

Statistik kan göras med kategoriska variabler, trots att de inte är numeriska eller kvantitativa variabler. Ta till exempel för att känna till trenden eller det mest troliga värdet för en kategorisk variabel Mode.

Mode det är i detta fall det mest upprepade resultatet eller värdet av en kategorisk variabel. I kategoriska variabler är det inte möjligt att beräkna varken medelvärdet eller medianen.

Medelvärdet kan inte beräknas eftersom aritmetik inte kan göras med kategoriska variabler. Inte heller är medianen, eftersom de kvantitativa eller kategoriska variablerna inte har någon ordning eller hierarki, så det är inte möjligt att bestämma ett centralt värde..

Grafisk representation av kategoriska variabler

Med en viss kategorisk variabel kan frekvensen eller antalet gånger som ett resultat av variabeln upprepas hittas. Om detta görs för varje utfall kan en graf över frekvensen mot varje kategori eller utfall göras..

Här är några exempel på hur kategoriska variabler kan representeras grafiskt.

Lösta övningar

Övning 1

Ett företag har register över uppgifterna om 170 anställda. En av variablerna i dessa register är: Civil status. Denna variabel har fyra kategorier eller möjliga värden:

Enda (TILL), Gift (B), Änkling (C) , Skild (D).

Även om det är en icke-numerisk variabel är det möjligt att veta hur många av de totala posterna som finns i en viss kategori och representeras i form av ett stapeldiagram, som visas i följande bild:

Figur 2. Representation av resultaten av en kategorisk variabel. Källa: självtillverkad

Exempel 2

En skoaffär håller reda på sin försäljning. Bland variablerna som hanterar sina poster är skofärgen för varje modell. Variabeln: 

Color_Shoe_Model_AW3

Den är kategorisk och har fem möjliga kategorier eller värden. För varje kategori av denna variabel summeras antalet försäljningar och andelen fastställs. Resultaten presenteras i diagrammet för följande figur:

Figur 3. Kategori variabel Färg _Sko. I denna variabel är läget Vit. Källa: självtillverkad.

Det kan då sägas att AW3-skomodellen som finns i mode, den som säljs oftast är Vit, tätt följt av Svart

Det kan också sägas att med 70% sannolikhet kommer nästa sko som säljs av denna modell att vara Vit eller Svart.

Denna information kan vara användbar för butiken när du gör nya beställningar, eller den kan till och med tillämpa rabatter på de minst sålda färgerna på grund av överflödigt lager..

Exempel 3

För en viss population av blodgivare vill du representera antalet personer som tillhör en viss blodgrupp. Ett grafiskt sätt att visualisera resultaten är med hjälp av ett piktogram, som i bakgrunden är en tabell.

Den första kolumnen representerar variabeln Blod typ och dess möjliga resultat eller kategorier. Den andra kolumnen visar representationen i ikonisk eller bildlig form av antalet personer i varje kategori. I vårt exempel används en röd droppe som en ikon, som var och en representerar 10 personer.

Figur 4. Piktogram. Källa: självtillverkad

Referenser

  1. Khan akademin. Analysera kategoriska data. Återställd från: khanacademy.org
  2. Universumsformler. Kvalitativ variabel. Återställd från: univesoformulas.com
  3. Minitab. Vilka är kategoriska, diskreta och kontinuerliga variabler. Återställd från: support.minitab.com
  4. Excel-handledning. Karaktärisering av variabler. Återställd från: help.xlslat.com.
  5. Wikipedia. Statistisk variabel. Återställd från wikipedia.com
  6. Wikipedia. Kategorisk variabel. Återställd från wikipedia.com
  7. Wikipedia. Kategorisk variabel. Återställd från wikipedia.com

Ingen har kommenterat den här artikeln än.