firfog.pages.dev









Hur gör man kvartillerna på ett lådagram

Kvartiler samt lådagram

I detta förra avsnittet angående lägesmått använde oss oss från en modell tillsammans enstaka släktmiddag liksom familjen Mattecentrum anordnade.

Lådagram Den redovisade datamängden i lådagrammet motsvarar, precis som ett cirkeldiagram alltid $100$ 100 %

Åldrarna vid dem närvarande personerna nära släktmiddagen var

$$1,\, 4,\, 3,\, 15,\, 72,\, 41,\, 30,\, 27,\, 72,\, 8,\, 42,\, 36,\, 33,\, 46,\, 44$$

En individ såsom ej plats tillsammans vid släktmiddagen fanns Mattias, likt istället plats vid kvällsmål tillsammans med en antal vänner. Åldern vid dem 15 personer såsom fanns tillsammans med nära Mattias kvällsmål plats såsom följer:

$$30,\, 31,\, 33,\, 34,\, 35,\, 34,\, 28,\, 34,\, 33,\, 34,\, 36,\, 35,\, 32,\, 31,\, 32$$

Vi jämför lägesmåtten vad gäller åldern vid personerna inom dessa båda grupper.

Då ser oss för att medelvärdet samt medianen på grund av släktmiddagen är

$$medel=31,6 \,år$$

$$median=33 \,år$$

För personerna likt deltog nära kompismiddagen blir lägesmåtten följande:

$$medel=32,8\,år$$

$$median=33\,år$$

Tittar oss bara vid dessa lägesmått därför ser detta ej ut såsom för att detta fanns sålunda massiv skillnad mellan åldrarna nära dem numeriskt värde tillställningarna, utom möjligtvis för att gruppen såsom närvarade nära kompismiddagen verkar aningen äldre ifall man jämför medelvärdena.

oss vilket dock besitter sett åldrarna liksom förekommer inom dem numeriskt värde grupperna vet för att detta existerar massiv skillnad vid spridningen från åldrarna mellan dem numeriskt värde grupperna - nära släktmiddagen existerar spridningen massiv, medan spridningen nära kompismiddagen existerar mindre.

För för att behärska jämföra numeriskt värde alternativt flera serier från observationsvärden besitter man därför infört olika mått för hur något sprids.

Genom dessa kunna man erhålla ett mer rättvisande foto från hur olika serier från värden ser ut samt hur massiv spridningen existerar inom dem olika serierna.


  • hur  utför man kvartillerna  vid  en lådagram

  • inom detta på denna plats avsnittet bör oss därför vandra igenom begreppen variationsbredd, kvartiler samt lådagram, på grund av för att inom nästa segment titta närmare vid standardavvikelse vilket en mått vid hur många värden avviker ifrån medelvärdet inom enstaka serie.

    Variationsbredd

    Ett enkelt mått vid spridning inom enstaka serie observationsvärden existerar variationsbredd, såsom definieras likt skillnaden (differensen) mellan detta största samt detta minsta observationsvärdet inom serien.


    I vårt modell tillsammans med släktmiddagen får oss variationsbredden vilket gäller ålder genom för att subtrahera den högsta förekommande åldern (72 år) samt den lägsta (1 år)

    Det önskar säga

    $$72-1=71\, år$$

    På identisk sätt kalkylerar oss variationsbredden vad gäller ålder nära kompismiddagen, var den högsta åldern plats 36 tid samt den lägsta 28 kalenderår.

    oss får inom detta fall variationsbredden

    $$36-28=8\, år$$


    Som oss ser sålunda får oss väldigt olika värden vid variationsbredden inom dem båda grupperna, vilket ju beror vid för att åldersspridningen existerar många större nära släktmiddagen än nära kompismiddagen.

    Variationsbredden existerar alltså många lätt för att räkna ut, dock detta mått äger nackdelen för att detta ej tar hänsyn mot varenda observationsvärdena, utan enbart detta största samt detta minsta värdet.

    på grund av för att ett fåtal ett förbättrad foto från spridningen använder man därför även andra spridningsmått.

    Kvartiler

    Ett förbättrad sätt för att förklara spridningen runt medianen existerar för att dela in observationsvärdena inom kvartiler. Kvartil betyder fjärdedel samt dessa kvartiler kommer oss fram mot genom för att dela in våra storlekssorterade observationsvärden inom fyra lika stora grupper.

    Det finns fem viktiga värden för att hålla koll vid då oss bör dela in våra observationsvärden inom kvartiler:

    Det högsta värdet samt detta lägsta värdet, likt existerar dem maximalt extrema observationsvärdena oss besitter åt vardera hållet inom följd.

    Dessa motsvarar alltså detta största samt detta minsta värdet såsom oss använde då oss räknade ut variationsbredden tidigare inom avsnittet.

    Vi behöver även uppleva mot medianen, såsom ju delar våra storlekssorterade observationsvärden inom numeriskt värde lika stora delar.

    De numeriskt värde sista värdena vilket oss måste ta reda vid existerar den nedre kvartilen, likt delar dem lägre 50 % från värdena inom numeriskt värde lika stora delar, samt den övre kvartilen, liksom delar upp dem högre 50 % från värdena inom numeriskt värde lika stora delar.

    Från dessa kan man rita ett lådagram, som markerar det största och det minsta talet

    Detta innebär för att 25 % från våra observationsvärden kommer för att artikel mindre än den nedre kvartilen samt 75 % från observationsvärdena kommer för att artikel mindre än den övre kvartilen.

    Ofta betecknar man den nedre kvartilen såsom Q1, medianen såsom Q2 samt den övre kvartilen liksom Q3.

    Vi visar hur dessa viktiga värden förhåller sig mot observationsvärdena inom figuren nedan.


    När oss idag äger gått igenom definitionerna från dessa term är kapabel oss beräkna dessa fem värden på grund av våra numeriskt värde middagssällskap

    Skillnaden mellan den övre samt den nedre kvartilen kallas på grund av kvartilavståndet.

    Detta motsvarar variationsbredden till dem 50 % från värdena vilket befinner sig inom mitten från följd från observationsvärden. på det sättet existerar kvartilavståndet en mått vid hur massiv spridningen existerar inom närheten från medianen.

    Kvartilavståndet på grund av deltagarnas ålder nära släktmiddagen får oss genom denna definition till

    $$44-8= 36\, tid $$

    På motsvarande sätt kalkylerar oss kvartilavståndet på grund av deltagarnas ålder nära kompismiddagen till

    $$34-31=3\, år$$


    Lådagram

    Med hjälp från dem term rörande kvartiler såsom oss äger introducerat ovan förmå oss åskådliggöra spridningen runt medianen tillsammans med hjälp från lådagram.

    Ett lådagram ritas vid enstaka tallinje samt består från ett kista (rektangel) vars vänstra respektive högra blad befinner sig nära den nedre respektive den övre kvartilen.

    Observationsvärdenas medianvärde existerar även markerat tillsammans med ett vertikal linje inuti lådagrammet. ifrån lådans respektive sidor sträcker sig ett vågrät linje ut mot detta största respektive lägsta observationsvärdet inom serien.

    Nedan besitter oss ritat en lådagram på grund av värden inom intervallet 1 (lägsta värdet) mot samt tillsammans med 21 (högsta värdet).

    google

    inom detta modell existerar medianen 11, nedre kvartilen 6 samt övre kvartilen 16.

    På motsvarande sätt förmå oss presentera observationsvärdena ifrån vår rapport från åldern vid deltagarna nära släktmiddagen respektive kompismiddagen tillsammans med hjälp från nästa numeriskt värde lådagram:

    Nu är kapabel oss klart titta för att även ifall deltagarna nära dem båda middagarna ägde identisk medianålder (33 år) således existerar detta massiv skillnad inom spridningen från åldrar.

    Percentiler

    På motsvarande sätt såsom man kunna dela upp observationsvärden inom fjärdedelar (kvartiler) förmå man även dela upp stora serier från observationsvärden inom hundradelar.

    fullfölja man ett uppdelning inom hundradelar benämner man dessa hundradelar liksom percentiler.

    Specifika percentiler benämner man vid en liknande sätt liksom kvartiler. mot modell motsvarar den nedre kvartilen, Q1, den 25:e percentilen, vilket oss betecknar P25 (alltså för att 25 % från observationsvärdena bör artikel mindre än detta värde).

    vid motsvarande sätt kunna man beteckna medianen vilket P50 samt övre kvartilen vilket P75.

    Eftersom vårt observationsmaterial ifrån dem båda middagarna existerar således resehandling litet (15 observationsvärden inom vardera fallet) existerar detta mer lämpligt för att nyttja sig från kvartiler än percentiler. ägde oss haft ett serie bestående från en större antal observationsvärden, mot modell ifall man gjorde ett studie från åldern bland tusen människor, då ägde användning från percentiler kunnat artikel mer användbar.

    I nästa del bör oss gå vidare för att undersöka hur man är kapabel ange spridningen inom serier från observationsvärden, genom användning från måttet standardavvikelse.

    Läs sidan på andra språk