Extras din curs
1 NOŢIUNI GENERALE
Metoda sondajului poate să salveze timp şi bani oferind informaţii despre seturi largi de date fără ca să fie necesară observarea şi cercetarea tuturor elementelor ce alcătuiesc colectivitatea. Procesul va cuprinde atunci două etape:
— etapa descriptivă, în care se culeg date şi se calculează indicatorii ce caracterizează subcolectivitatea analizată;
— etapa inferenţială, în care rezultatele obţinute pentru această subco¬lec¬tivitate se extind, în termeni probabilistici, la colectivitatea generală.
Selecţia statistică reprezintă operaţia de extragere a unei părţi dintr-o colectivitate statistică, a unei subcolectivităţi numi¬tă şi eşantion, mos¬tră, colectivitate parţială sau colectivitate de selecţie.
Cercetarea statistică totală şi cercetarea statistică prin sondaj sunt posi¬bilităţi alternative şi perechi de investigaţie statistică.
Evident, volumul eşantionului este întotdeauna mai mic decât cel al co¬lec¬tivităţii generale (totale). Vom nota, atunci, volumul colectivităţii gene¬rale cu N şi volumul colectivităţii de selecţie cu n, 1 n N-1. În cazul în care datele au fost sistematizate în r grupe după variaţia unei caracteristici de grupare, vom avea:
Eroarea de estimaţie reprezintă diferenţa dintre estimatorul obţinut pe eşantion (estimaţia) şi valoarea parametrului din colec-tivitatea generală. Ea este în general necunoscută.
Un estimator este nedeplasat dacă nu este în mod sistematic diferit (sis¬tematic mai mare sau sistematic mai mic) decât parametrul cores¬pun¬zător din populaţia generală. Adică, un estimator este nedeplasat dacă valoarea sa medie scontată (obţinută ca media estimaţiilor din toate eşantioanele posi¬bile) este egală cu parametrul populaţiei.
Estimatorii şi parametrii sunt aşadar noţiuni perechi. Astfel, media aritmetică, principalul indicator al tendinţei centrale, va fi notat cu în ca¬zul în care este parametrul colectivităţii totale şi cu în cazul în care este un indicator obţinut printr-o cercetare statistică prin sondaj.
Parametrul colectivităţii generale se calculează:
sau:
Dispersia, se va nota cu , dacă este para¬metru obţinut în colectivitatea generală şi cu s2, dacă este estimatorul para¬me¬trului, obţinut pe un eşantion.
Astfel, parametrul colectivităţii generale este:
respectiv în cazul datelor grupate:
iar estimatorul dispersiei din colectivitatea generală, anume dispersia eşan¬tionului:
sau în cazul distribuţiei de frecvenţe:
Atunci când eşantioanele sunt de volum mare (n>30), se poate renunţa la scăderea lui 1 din numitorul dispersiei.
În cazul caracteristicilor binare (de tip alternativ), media aritmetică este:
— parametrul colectivităţii generale:
— estimatorul obţinut în eşantion:
Dispersia caracteristicii alternative se va nota în populaţia generală cu:
iar¬ în eşantion (estimatorul dispersiei din colectivitatea generală):
Metoda selecţiei aleatoare este modelul de bază utilizat pentru a asigura reprezentativitatea eşantionului, ceea ce face ca această metodă să fie reco¬mandată în mod deosebit în cercetarea statistică parţială.
2 DISTRIBUŢIA DE EŞANTIONARE
A MEDIEI
Un eşantion particular are o şansă de apariţie, deci este o variabilă aleatoare. Desigur că, în prac¬tică, lucrăm de obicei cu un singur eşantion, iar indicatorul obţinut poate să ne apară ca un număr fix, dar rezultatul trebuie privit din perspec¬tiva tuturor eşanti¬oanelor posibile, deci a tuturor rezultatelor posibile (figura nr. 5.2).
Figura - Obţinerea unei distribuţii de eşantionare
Distribuţia de eşantionare a oricărui indicator statistic (deci şi a mediei) are o medie, o dispersie şi o abatere medie pă¬tratică. Dacă se cunoaşte această abatere medie pătratică, se poate şti va¬riaţia aproximativă a indicatorului statistic din eşantion faţă de valoarea sa medie (parametrul populaţiei). Această abatere medie pătratică depinde, însă, de colectivitatea generală şi soluţia este să se estimeze, pe baza eşan¬tio¬nului, abaterea medie pătratică a distribuţiei de eşantionare. Estimatorul abaterii medii pătratice a unui indicator, bazat pe datele dintr-un eşantion, se numeşte eroare standard a indicatorului (eroarea medie de reprezenta¬tivitate) şi se interpretează ca orice abatere medie pătratică. Ea este o eroare de reprezentativitate şi este specifică sondajului statistic.
Media de sondaj:
este un estimator nedeplasat al mediei a colectivităţii generale, dacă se îndeplineşte condiţia ca media mediilor de selecţie să fie egală cu media generală (parametrul colectivităţii). Aceasta înseamnă că:
relaţie care exprimă că media de sondaj este un indicator nedeplasat al mediei , parametrul colectivităţii generale.
Este important să recunoaştem că distribuţia lui este diferită de distribuţia lui x şi, chiar dacă media mediilor de selecţie este egală cu media din colectivitatea generală, totuşi, dispersia lui nu este egală cu dispersia lui x:
Aşadar, un alt parametru al distribuţiei de eşantionare, dispersia medie de sondaj se calculează ca:
Ea este deci de n ori mai mică decât dispersia variabilei în colectivitatea generală.
Eroarea standard a mediei de sondaj este , adică abaterea medie pătratică a mediei de selecţie de la parametrul :
Preview document
Conținut arhivă zip
- Sondajul Statistic - Determinarea Intervalelor de Incredere.doc