Parametry
statystyczne - są to
wielkości liczbowe, które służą do opisu struktury
zbiorowości statystycznej w sposób systematyczny |
Miary pozycyjne
|
modalna
kwantyle:
-
kwartyl
pierwszy
-
mediana (kwartyl
drugi)
-
kwartyl
trzeci
-
decyle
|
Miary
przeciętne
charakteryzują
średni lub typowy poziom wartości cechy, wokół których
skupiają się wszystkie pozostałe wartości analizowanej
cechy
|
średnia
arytmetyczna
średnia
harmoniczna
średnia
geometryczna
modalna
|
Średnia arytmetyczna
Średnią
arytmetyczną -
definiuje się jako sumę wartości cechy mierzalnej
podzieloną przez liczbę jednostek skończonej zbiorowości
statystycznej. |
szereg szczegółowy |
(eq.1) |
gdzie: n -
liczebność zbiorowości próbnej (próby), xi -
wariant cechy. Jest to tzn. średnia nieważna (prosta)
- stosowana dla szeregów szczegółowych.
Średnia arytmetyczna ważona
szereg rozdzielczy
punktowy |
(eq.2) |
szereg rozdzielczy z
przedziałami klasowymi |
(eq.3) |
gdzie:
oznacza środek przedziału klasowego
Średnia arytmetyczna (średnia ważona) dla r-grup
łącznie oraz średnich arytmetycznych cząstkowych i
liczebności i-tej grupie ni:
(eq.4)
|
gdzie
jest sumą liczebności we wszystkich r-grupach.
Podstawiając w miejsce ni wskaźnik struktury wi
otrzymamy zależności:
lub
|
|
Wybrane właściwości
średniej arytmetycznej
Średnia harmoniczna
Średnią
harmoniczną - stosuje
się wtedy, gdy wartości cechy są podane w przeliczeniu na
stałą jednostkę innej zmiennej, czyli w postaci
wskaźników natężenia, wagi natomiast w jednostkach
liczników tych cech, np. prędkość pojazdu w km/h. |
szereg szczegółowy |
|
szereg rozdzielczy |
|
Przyjmując, że waga
oraz :
Średnia geometryczna
Średnią
geometryczną - stosuje
się w badaniach średniego tempa zmian zjawisk, a więc gdy
zjawiska są ujmowane dynamicznie. |
Modalna
Modalna
Mo (dominanta D, moda, wartość najczęstsza - jest
to wartość cechy statystycznej, która w danym rozdziale
empirycznym występuje najczęściej |
Dla szeregów szczegółowych
oraz szeregów rozdzielczych punktowych
modalna odpowiada wartości cechy o największej liczebności (częstości).
W szeregach rozdzielczych z
przedziałami klasowymi bezpośrednio można określić
tylko przedział, w którym modalna występuje, jej przybliżoną
wartość wyznacza się graficznie z histogramu liczebności (częstości)
lub ze wzoru interpolacyjnego:
gdzie:
m -
numer przedziału (klasy), w którym występuje modalna,
- dolna granica przedziału, w którym występuje modalna,
nm
- liczebność przedziału modalnej, tzn. klasy o numerze m,
nm-1;
nm+1 - liczebność klas poprzedzającej
i następnej, o numerach m – 1 i m + 1,
hm
- rozpiętość przedziału klasowego, w którym występuje modalna.
Kwantyle
Kwantyle
- definiuje się jako wartości cechy badanej zbiorowości,
przedstawionej w postaci szeregu statystycznego, które
dzielą zbiorowość na określone części pod względem
liczby jednostek, części te pozostają do siebie w określonych
proporcjach. |
Kwartyl
pierwszy Q1 |
dzieli zbiorowość
na dwie części w ten sposób, że 25% jednostek zbiorowości
ma wartości cechy niższe bądź równe kwartylowi pierwszemu
Q1, a 75% równe bądź wyższe od tego
kwartyla
|
Kwartyl
drugi (mediana Me) |
dzieli zbiorowość
na dwie równe części; połowa jednostek ma wartości cechy
mniejsze lub równe medianie, a połowa wartości cechy równe
lub większe od Me; stąd nazwa wartość
środkowa |
Kwartyl
trzeci Q3 |
dzieli zbiorowość
na dwie części w ten sposób, że 75% jednostek zbiorowości
ma wartości cechy niższe bądź równe kwartylowi pierwszemu
Q3, a 25% równe bądź wyższe od tego
kwartyla |
Decyle |
np. decyl pierwszy
oznacza, że 10% jednostek ma wartości cechy mniejsze bądź
równe od decyla pierwszego, a 90% jednostek wartości cechy równe
lub większe od decyla pirwszego |
Kwartyl drugi (mediana Me)
Dla szeregu szczegółowego
Dla szeregu rozdzielczego
(graficznie lub analitycznie)
gdzie:
m -
numer przedziału (klasy), w które występuje mediana,
-
dolna granica przedziału, w którym występuje mediana
nm
- liczebność przedziału mediany, tzn. klasy o numerze m,
- suma liczebności przedziałów poprzedzających przedział mediany,
czyli liczebność skumulowana,
hm
- rozpiętość przedziału klasowego, w którym jest mediana,
NMe
- pozycja mediany, czyli
Kwartyl pierwszy Q1 i trzeci Q3
Dla szeregu szczegółowego
kwartyl pierwszy i trzeci wyznacza się w ten sposób, że w dwóch
częściach zbiorowości, które powstały po wyznaczeniu mediany,
ponownie wyznacza się medianę; mediana w pierwszej części
odpowiada kwartylowi pierwszemu, a w drugiej kwartylowi trzeciemu.
Dla szeregu rozdzielczego
wyznaczenie kwartyli poprzedza się ustaleniem ich pozycji:
Kwartyl pierwszy Q1
Kwartyl trzeci Q3
gdzie:
m -
numer przedziału (klasy), w którym występuje odpowiadający mu
kwartyl,
- dolna granica tego przedziału,
nm
- liczebność przedziału, w którym występuje odpowiedni kwartyl,
- liczebność skumulowana do przedziału poprzedzającego kwartyl,
hm
- rozpiętość przedziału klasowego, w którym jest odpowiedni
kwartyl.
Miary zmienności (rozproszenia, dyspersji)
|
Miary klasyczne
|
Miary pozycyjne
|
wariancja
odchylenie
standardowe
odchylenie
przeciętne
współczynnik
zmienności
|
rozstęp
odchylenie ćwiartkowe
współczynnik
zmienności
|
Rozstęp
Rozstęp
- różnica pomiędzy wartością maksymalną, a minimalną
cechy - jest miarą charakteryzującą empiryczny obszar
zmienności badanej cechy, nie daje on jednak informacji o
zróżnicowaniu poszczególnych wartości cechy w zbiorowości. |
Wariancja
Wariancja
- jest to średnia arytmetyczna kwadratów odchyleń
poszczególnych wartości cechy od średniej arytmetycznej
zbiorowości. |
szereg szczegółowy |
|
szereg rozdzielczy
punktowy |
|
szereg rozdzielczy z
przedziałami klasowymi |
|
Wykonując proste przekształcenia algebraiczne,
otrzymamy:
Odchylenie standardowe, odchylenie przeciętne
Odchylenie
standardowe s - jest to pierwiastek kwadratowy z
wariancji. Stanowi miarę zróżnicowania o mianie zgodnym z
mianem badanej cechy, określa przeciętne zróżnicowanie
poszczególnych wartości cechy od średniej arytmetycznej. |
Typowy obszar
zmienności cechy - około 2/3 wszystkich jednostek badanej
zbiorowości statystycznej posiada wartości cechy w tym przedziale:
Odchylenie przeciętne
Odchylenie przeciętne
d - jest to średnia arytmetyczna bezwzględnych
odchyleń wartości cechy od średniej arytmetycznej. Określa
o ile jednostki danej zbiorowości różnią się średnio,
ze względu na wartość cechy, od średniej arytmetycznej. |
szereg
szczegółowy |
|
szereg
rozdzielczy |
|
Pomiędzy odchyleniem
przeciętnym i standardowym, dla tego samego szeregu, zachodzi
relacja: d < s.
Odchylenie ćwiartkowe
Odchylenie ćwiartkowe
Q - jest to parametr określający odchylenie wartości
cechy od mediany. Mierzy poziom zróżnicowania tylko części
jednostek; po odrzuceniu 25% jednostek o wartościach
najmniejszych i 25% jednostek o wartościach największych. |
Typowy obszar
zmienności cechy:
Współczynnik zmienności
Współczynnik
zmienności - jest ilorazem bezwzględnej mary
zmienności cechy i średniej wartości tej cechy, jest
wielkością niemianowaną, najczęściej podawaną w
procentach. |
Klasyczne współczynniki
zmienności:
Pozycyjne współczynniki
zmienności:
oraz
Współczynnik zmienności
stosuje się w porównaniach zróżnicowania:
-
kilku zbiorowości
pod względem tej samej cechy,
-
tej samej zbiorowości
pod względem kilku różnych cech.
wskaźnik skośności
współczynnik
skośności
|
Rozkłady różnią się
między sobą kierunkiem i siła asymetrii (miary klasyczne):
-
dla szeregów
symetrycznych
-
jeżeli asymetria
prawostronna
-
jeżeli asymetria
lewostronna.
Wskaźnik skośności
- jest to wielkość bezwzględna wyrażona jako różnica
między średnią arytmetyczną a modalną |
Wskaźnik skośności
można wyznaczyć również przy pomocy miar pozycyjnych:
-
w rozkładzie
symetrycznym:
-
przy asymetrii
prawostronnej:
-
przy asymetrii
lewostronnej:
Współczynniki
skośności (asymetrii) - są stosowane w porównaniach,
do określenia siły oraz kierunku asymetrii, są to liczby
niemianowane, im większa ich wartość tym silniejsza
asymetria. |
Pozycyjny współczynnik
asymetrii określa kierunek i siłę asymetrii jednostek znajdujących
się miedzy pierwszym z trzecim kwartylem.
współczynnik
skupienia (koncentracji) (kurtoza)
współczynnik
koncentracji Lorenza
|
Współczynnik
skupienia (koncentracji) (kurtoza) K -
jest miarą skupienia poszczególnych obserwacji wokół średniej.
Im wyższa wartość współczynnika tym bardziej wysmukła
krzywa liczebności, większa koncentracja wartości cech
wokół średniej. |
gdzie:
szereg szczegółowy |
|
szereg rozdzielczy |
|
Jeżeli przyjmiemy, że
zbiorowość ma rozkład normalny, to K = 3, są bardziej spłaszczony
rozkład od normalnego ma K < 3, a brdziej wysmukły K >
3. Stąd:
|