Vyhľadať

JAMOVI – Opisná štatistika

Pomocou základných štatistík: priemer, modus, medián, štandardná smerodajná odchýlka, rozptyl, minimum, maximum, rozpätie, šikmosť a špicatosť opisujeme súbor dát a jeho vlastnosti.

Stručné vysvetlenie jednotlivých štatistík:

  • Priemer (Mean) je aritmetický priemer.
  • Modus (Mode) najčastejšie sa vyskytujúca hodnota v súbore.
  • Medián (Median) delí celé spektrum dát na polovicu. Určuje takú hodnotu, že polovica jednotiek v súbore je menšia ako táto hodnota a polovica jednotiek v súbore je väčšia.
  • Štandardná smerodajná odchýlka (Standard deviation) ukazuje, do akej miery sú jednotlivé merané hodnoty rozložené okolo strednej hodnoty. Čím je smerodajná odchýlka menšia, tým bližšie sú merané hodnoty okolo strednej hodnoty (priemeru), väčšia smerodajná odchýlka hovorí o tom, že v súbore sa vyskytli výraznejšie odklony od priemeru a väčší rozptyl.
  • Rozptyl (Variance) je vyjadrením variability v súbore a smerodajná odchýlka je druhá odmocnina rozptylu. Čím máme v súbore dáta odlišnejšie od priemeru, tým je rozptyl väčší.
  • Minimum (Minimum) je minimálna hodnota v súbore.
  • Maximum (Maximum) je maximálna hodnota v súbore.
  • Medzikvartilové rozpätie (Range) je rozdiel medzi horným (tretím) kvartilom a spodným (prvým) kvartilom.
  • Šikmosť (Skewness) Ak vyjde koeficient šikmosti menší ako 0 ide o vpravo zošikmené rozdelenie, ak je koeficient vyšší ako 0 ide o vľavo  zošikmené rozdelenie. Ak vyjde koeficient šikmosti 0, potom ide o symetrické rozdelenie.
  • Špicatosť- (Kurtosis) vyjadruje rozloženie dát v súbore. Ak je výsledok väčší ako 0 potom je to špicatejšie rozdelenie a ak je výsledok menší ako 0 potom je rozdelenie plochejšie. Špicaté rozdelenie prakticky znamená, že väčšina hodnôt v súbore je blízko priemeru.

 

Zadanie:

Pomocou nástrojov deskriptívnej štatisticky opíšte premennú: Vzťahy so zákazníkmi. Výsledky interpretujte. Spracujte: opisné štatistiky a ich interpretáciu, grafy a ich interpretáciu:

  • Histogram
  • Q-Q graf

 

Riešenie:

Klikneme na kartu Analyzovať (Analyse) → Explorácia (Exploration) → Opisná štatistika (Descriptives). V ľavej časti okna sú uvedené všetky premenné v našom súbore. Vyberieme kardinálnu premennú zo zadania s názvom: Vzťahy so zákazníkmi a presunieme ju do pravej časti okna s názvom Premenné (Variables). Keď prejdeme nižšie, sprievodca testom nám ponúka jednotlivé opisné štatistiky. Zaškrtávaním políčok vyberiem tie, ktoré potrebujeme (z oblastí Štatistika (Statistics)  a Grafy (Plots) a postupne sa nám v pravej časti (Výsledky) ukazuje celá analýza v podobe tabuľky.

Obr. 1 Postup riešenia výpočtu opisných štatistík.
Obr. 2 Postup zaklikávania konkrétnych opisných štatistík

Výsledky: Program Jamovi vytvorí tabuľku s výsledkami. V tabuľke č.1 vidíme, že sme mali 200 respondentov (N) – ako výberový súbor a ani v jednom z nich nám nechýbali hodnoty (Missing).

Tab. 1 Výsledky riešenia opisnej štatistiky
Tab. 2 Výsledky riešenia opisnej štatistiky - ďalšie

Interpretácia

Priemer M = 6,30 je priemerná hodnota, ktorá naznačuje, že podnikatelia majú zadefinovanú kategóriu zákazníkov dobre (je nad polovicou škály) a súčasne Smerodajná odchýlka SD = 2,17 naznačuje variabilitu v súbore. Premenná je meraná na škále od 0 po 10, teda maximálna hodnota, ktorú mohol respondent dosiahnuť bola 10 bodov a minimálna hodnota bola 0 bodov. Medián, Me = 7, teda polovica podnikateľov má hodnoty pod skóre 7 a polovica nad skóre 7. Modus, Mo = 7 a hovorí o tom, že najčastejšie vyskytujúca hodnota bola 7. Šikmosť má hodnotu -0,99, čo je záporná hodnota, a preto ide o vpravo zošikmené rozdelenie, čo je viditeľné aj v grafe. Špicatosť je naopak kladná (0,34), je to väčšie ako 0, preto ide o špicatejšie rozdelenie.

Graf. 1 Histogram

Na grafe č. 1 je znázornený Histogram, ktorý ukazuje najpočetnejšie vyskytujúce sa hodnoty v pravej časti grafu.

Graf. 2 Q-Q graf

Graf č.2 znázorňuje aj Q-Q graf a ukazuje v spodnej a hornej časti vychýlenie od osi a hovorí o nerovnomernom rozložení dát.

Reportovanie výsledkov:

Vždy je potrebné, aby sa pri publikovaní vedeckých článkov uvádzal priemer a smerodajná odchýlka z našich skúmaných dát. Priemerná hodnota je M = 6,30; smerodajná odchýlka SD = 2,17. Minimálna hodnota Min = 0, maximálna Max = 10. Náš výberový súbor tvorilo celkovo 200 respondentov. Vďaka takto uvedeným údajom, dokážu aj iní vedci použiť tieto čísla na medzinárodné porovnávania a aj na metaanalýzy.

Spracovala Nina Kocúrová, Január 2022