Grupowanie materiału statystycznego
|
Rodzaje grupowania:
- typologiczne - (np. wg cech terytorialnych,
rzeczowych, czasowych) mające na celu wyodrębnienie grup różnych
jakościowo,
- wariacyjne - mające na celu uporządkowanie badanej
zbiorowości i poznanie jej struktury, które polega na łączeniu w
klasy jednostek statystycznych o odpowiednich wartościach cech
statystycznych.
Szereg statystyczny
- ciąg wielkości statystycznych, uporządkowanych wg określonego
kryterium.
|
Sposób grupowania
cech zależy od: rodzaju badania (przekrojowe, czasowe), rodzaju cechy
statystycznej, sposobu pomiaru oraz liczby obserwacji (szczegółowe,
rozdzielcze).
Szereg szczegółowy
- uporządkowany ciąg wartości badanej cechy statystycznej,
stosowany, gdy przedmiotem badania jest niewielka liczba
jednostek, np. zmienna X przyjmuje wartości: ,
wartości cechy porządkujemy rosnąco:
lub malejąco .
|
Szereg rozdzielczy
- stanowi zbiorowość statystyczną, podzieloną na części
(klasy) według określonej cechy jakościowej lub ilościowej
z podaniem liczebności lub częstości każdej z wyodrębnionych
klas.
|
Rozkład empiryczny
- zestawienie wyników w postaci szeregu rozdzielczego z cechą
mierzalną, odzwierciedla strukturę badanej zbiorowości z
punku widzenia określonej cechy statystycznej.
|
Szeregi
statystyczne
|
szczegółowe |
rozdzielcze
z cechą mierzalną (ilościową):
- punktowe
(proste, skumulowane),
- przedziałowe
(proste, skumulowane),
rozdzielcze
z cechą niemierzalną (jakościową:
- geograficzne
- inne
|
czasowe
-
momentów
-
okresów
|
Stosowanie szeregów
statystycznych:
-
szereg
rozdzielczy z przedziałami klasowymi - dla cech ciągłych
-
szeregi
rozdzielcze bez przedziałów klasowych lub z
przedziałami klasowymi - dla cech mierzalnych skokowych -
zależnie od możliwości wartości (wariantów) cech: dla
niewielkiej liczby wariantów: szereg rozdzielczy punktowy, dla dużej
szereg rozdzielczy z przedziałami klasowymi.
-
szereg
rozdzielczy z cechą niemierzalną - szereg geograficzny
(terytorialny) - przedstawia rozmieszczenie pewnych zjawisk w
przestrzeni (np. zestawienie liczby gmin w Polsce).
-
szereg
czasowy - (dynamiczny chronologiczny) powstaje w wyniku
grupowania typologicznego i wariacyjnego, gdy podstawą grupowania
jest zmiana badanego zjawiska w czasie:
- szereg czasowy okresów - zawiera informację o rozmiarach
zjawiska w krótszych lub dłuższych okresach.
- szereg czasowy momentów - ujmuje wielkość zjawiska w danym
momencie, najczęściej na początku lub końcu np. miesiąca.
Podstawowe oznaczenia, podstawowe wielkości
n - liczebność
próby (zbiorowości próbnej),
xi -
wariant cechy statystycznej (i = 1, 2 , ... , n),
ni -
liczba jednostek o i-tym wariancie cechy,
k - liczba klas
(wariantów cechy),
przy czym:
Szereg rozdzielczy punktowy
Wskaźnik struktury
wi lub częstość
(liczebność względna, frakcja, odsetek) - występowania
danego wariantu cechy nazywa się stosunek liczby jednostek o
danej wartości cechy do liczebności próby. |
(eq.1)
przy czym: .
Szereg rozdzielczy
skumulowany - uzyskuje się poprzez przyporządkowanie
kolejnym wariantom cechy odpowiadających im liczebności (częstości)
skumulowanych, informuje, dla ilu jednostek badanej zbiorowości
cecha przyjmuje wartości nie większe od górnej granicy
poszczególnego przedziału klasowego. |
Skumulowany
wskaźnik struktury wisk
(częstość skumulowana):
(eq.2)
gdzie nisk
oznacza liczbę jednostek, których cechy odpowiadają wartościom nie
większym niż xi.
Dystrybuanta
empiryczna - przyporządkowanie kolejnym wartościom
cechy statystycznej (zmiennej) odpowiadających im częstości
skumulowanych (względnie liczebności skumulowanych). |
Szereg rozdzielczy z przedziałami klasowymi
a) Ustalanie liczby
klas
Liczby klas w zależności od liczebności
badanej zbiorowości
|
Liczba
obserwacji
n
|
Liczba
zalecanych klas
k
|
40-60
60-100
100-200
200-500
|
6-8
7-10
9-12
11-17
|
wzory:
(eq.3)
(eq.4)
b) ustalenie rozpiętości
przedziałów klasowych
Rozpiętość
(szerokość) przedziału klasowego hi - różnica
pomiędzy górną x1i i dolną x0i
granicą i-tego przedziału klasowego.
|
Z reguły ustala się jednakowe rozpiętości
przedziałów klasowych. Przy równej rozpiętości przedziałów
klasowych liczebności (częstości) występujące w poszczególnych
klasach są porównywalne.
Przy różnych rozpiętościach (dla
populacji niejednorodnej z dużą koncentracją wartości w jednej
grupie) zamiast liczebności (częstości)
stosuje się wskaźnik: gęstość liczebności
(gęstość częstości).
Gęstość
liczebności (gęstość częstości) - jest to
stosunek liczebności (częstości) danej klasy do rozpiętości
przedziału klasowego:
|
gęstość liczebności |
(eq.5) |
szereg rozdzielczy |
(eq.6) |
Dla szeregu rozdzielczego
o jednakowych rozpiętościach przedziałów klasowych hi
= h:
(eq.7)
gdzie: nazywa
się rozstępem, a k
oznacza liczbę klas.
Uwaga: Jeżeli
wybieramy przybliżoną wartość h, to powinno to być zawsze
przybliżenie z nadmiarem, tzn..
c) Ustalanie granic
poszczególnych klas
Jako dolną granicę najczęściej przyjmuje
się najmniejszą wartość cechy lub bliskiej tej wartości, czyli .
Przy cechach ciągłych górne granice klas poprzednich powinny być
dolnymi granicami klas następnych, aby nie było pomiędzy przedziałami
luk Ponadto trzeba ustalić, do które klasy zaliczyć wartości
graniczne.
W szeregach o otwartych
przedziałach klasowych, konieczne jest czasami domknięcie tych
przedziałów. Stosuję się tutaj zasadę, że jeżeli liczebność w
tych przedziałach jest niewielka (nie większa niż 5% badanej zbiorowości,
można te przedziały domknąć taką szerokością, jaka jest w sąsiednich
przedziałach klasowych.
Szereg rozdzielczy z przedziałami klasowymi
Wskaźnik podobieństwa struktury
|
Wskaźnik
podobieństwa struktury wp
- służy do porównywania struktur
analizowanych zbiorowości.
|
(eq.8)
przy czym:
(im wartość bliższa jedności, tym struktury zbiorowości są
bardziej podobne..
Wskaźniki
natężenia - są to wielkości stosunkowe, wyrażające
kształtowanie się wilkości jednego zjawiska na tle innego,
logicznie z nim związanego.
|
Przykładowe współczynniki
natężenia:
-
stopa
bezrobocia - stosunek liczby bezrobotnych do liczby ludności
czynnej zawodowo,
-
gęstość
zaludnienia - liczba ludności przypadająca na 1 km2
powierzchni,
-
wskaźnik
umieralności - liczba zmarłych do średniej liczby
ludności,
-
wskaźnik
rozwoju gospodarczego - produkt krajowy brutto (netto) do
liczby ludności kraju,
-
wskaźnik
wydajności pracy - wielkość produkcji do czasu pracy,
-
wskaźnik
spożycia i usług - wielkość spożycia i usług do
liczby ludności,
-
wskaźnik
rentowności - zysk
do wielkości sprzedaży,
-
wskaźnik
efektywności - zysk do zaangażowanego kapitału,
-
wskaźnik
produktywności - sprzedaż do do zaangażowanego kapitału.
|