Extras din curs
Parametri descriptivi
Acest capitol este unul hotarâtor în ce priveste importanta sa în economia întelegerii statisticii descriptive, dar si în ce priveste
manipularea formulelor matematice din statistica inferentiala.
În cadrul parametrilor tendintei centrale sunt incluse acele procedee care ofera o valoare reprezentativa (centrala) pentru sirul de
date masurat. Exista trei estimatori care pot fi utilizati în acest sens: media, mediana si modul.
În cadrul parametrilor variantei sunt incluse procedeele care ne arata în ce masura datele sunt omogene sau nu, masurând
împrastierea lor si implicit diferentierile care exista în interiorul sirului de date. Vor fi abordati în acest capitol urmatorii
indicatori ai variantei: amplitudinea, abaterea standard si dispersia.
Va fi introdus si un coeficient de variabilitate V pentru a ne da seama în ce masura un grup de date este omogen sau eterogen.
Valorile standard z, necesare descrierii unei valori dintr-un sir de date, sunt de asemenea prezentate. Complementar, sunt
prezentati indicatorii de asimetrie si de boltire care caracterizeaza o distributie a datelor si staninele, ca modalitate de clasificare a
datelor.
Indicatori ai tendintei centrale
Media
Media este un indicator care caracterizeaza un esantion (o populatie) din punctul de vedere al unei caracteristici studiate. Exista
mai multe notari pentru medie: M si x barat reprezinta media unui esantion, iar (miu) este media unei populatii.
Media se calculeaza simplu, adunând toate valorile dintr-un sir de date si împartind totalul la numarul de date:
M = X / N
Iata sirul de date:
X = (4, 8, 6, 7, 9, 11, 9, 9, 12, 7)
Media acestui sir de date este:
M = (4+8+6+7+9+11+9+9+12+7) / 10 = 82 / 10 = 8,2.
În cazul în care sirul de date este prezentat într-un tabel de frecvente vom aplica o alta formula:
Unde: fi reprezinta frecventa grupata, iar xi centrul intervalului. Iata si un exemplu cu date grupate:
Intervalul (i) Centrul i (x) Frecventa (fi) x * f
30-32 31 1 31
27-29 28 2 56
24-26 25 4 100
21-23 22 6 132
18-20 19 10 190
15-17 16 9 144
12-14 13 5 65
9-11 10 5 50
6-8 7 3 21
3-5 4 2 8
fi = 47 xi*fi= 797
Astfel M = 797 / 47 = 16,96
Caracteristicile mediei:
tine seama de toate cazurile si este afectata de valorile lor;
poate fi calculata fara ordonarea prealabila a datelor.
Mediana
Mediana este acel parametru care prin pozitia sa, se afla în mijlocul seriei de date. Ea reprezinta punctul central al seriei,
deoarece la stânga si la dreapta ei se situeaza câte 50% din totalitatea datelor. Mediana coincide cu media în cazul unei distributii
teoretice normale si se îndeparteaza mult de aceasta daca distributia este asimetrica.
Pentru a calcula mediana în cazul distributiei simple a datelor exista doua situatii:
a. când n este impar locul medianei se stabileste astfel:
loc mediana = (n+1) / 2
b. când n este par sunt adunate valorile din centrul seriei si se împart la doi.
Sa luam mai întâi sirul de date utilizat si pentru calcularea mediei:
X = (4, 8, 6, 7, 9, 11, 9, 9, 12, 7)
Este necesar mai întâi aranjarea datelor sirului într-o ordine fie crescatoare, fie descrescatoare:
Astfel, X devine (4, 6, 7, 7, 8, 9, 9, 9, 11, 12). Observam ca n este par (n=10). În acest caz vom lua valorile care se gasesc pe
locurile din mijlocul seriei, este vorba de locurile 5 si 6. Cele doua valori care se gasesc pe aceste locuri sunt 8 si 9. Pentru a
calcula mediana adunam cele doua valori gasite si împartim rezultatul la doi.
Astfel, Md = (8+9) / 2 = 8,5
Daca am fi renuntat la un numar din sir, sa spunem 12, am fi obtinut un sir de noua numere (4, 6, 7, 7, 8, 9, 9, 9, 11). În acest caz,
locul medianei este stabilit dupa formula data (n+1) / 2, în acest caz cinci. Mediana este valoarea care se gaseste pe pozitia din
mijlocul sirului ordonat de date (pozitia 5 în cazul de fata). Consultând sirul de date observam ca mediana ar fi 8. În cazul în care
sirul de date este prezentat într-un tabel de frecvente vom aplica formula:
Unde: l este limita inferioara a intervalului de clasa care contine mediana;
fc este frecventa cumulata precedând clasa care contine mediana;
fi este frecventa clasei intervalului care contine mediana;
N este numarul total al cazurilor;
j este marimea intervalului (i) care cuprinde mediana.
Vom calcula mediana pentru aceleasi date pe care le-am utilizat în calculul mediei pentru distributii grupate.
Preview document
Conținut arhivă zip
- Statistica sociala.pdf