Extras din proiect
Ne propunem să analizăm date extrase de pe site-ul Eurostat prin următoarele metode:
1. Analiza factorială în componente principale
2. Metoda clasificării ierarhice
3. Regresia multiplă
1.Analiza factorială în componente principale
Această tehnică are ca scop determinarea unor noi variabile numite componente principale şi exprimate sub forma combinaţiilor liniare de varibile originale astfel încat aceste noi combinaţii să aibă o variabilitate maximă, ceea ce se traduce prin faptul că ele vor aduce un maxim de informaţie posibilă, fără să existe informaţie redundantă.
Pentru a aplica analiza factorială, prin natura metodei, trebuie ca între variabile să existe corelaţii suficient de mari pentru a avea sens problema reducerii dimensiunii. Prin urmare, dacă o variabilă nu este corelată cu celelalte va trebui exclusă din analiză. În acelaşi timp, nici corelaţiile foarte mari (multicoliniaritatea) nu conduc la rezultate uşor de interpretat, situaţia extremă fiind cea de singularitate, a existenţei variabilelor perfect corelate. În asemenea cazuri este imposibil să se determine contribuţia individuală la un factor a variabilelor.
2.Metoda clasificării ierarhice
Plecând de la anumite variabile ce caracterizează structura unor ţări europene, ne dorim să aflăm cum se grupeazaă aceste ţări la momentul anului 2010 din perspectiva variabilelor analizate.
Dorim să aflăm daca putem descoperi clase sau grupe de ţări în cadrul carora setul de similitudini construit în jurul caracteristicilor studiate este unul destul de ridicat, şi să descoperim măsura în care ţările ce aparţin unor clustere diferite se deosebesc.
3.Regresia multiplă
Regresia multiplă este o metodă de predicţie a valorilor unei variabile dependente pornind de la valorile mai multor variabile independente. În psihologie situaţia cea mai tipică este aceea a examenelor de selecţie. În acest caz avem un set de variabile independente (numite şi "predictori"), care sunt scoruri la diferite teste utilizate, şi o variabilă dependentă (numită si "criteriu"), ale cărei valori vrem să le estimăm pornind de la relaţiile acesteia cu toate variabilele independente. În esenţă, regresia multiplă este o procedură similară regresiei simple. Aşa cum regresia simplă se bazează pe corelaţia dintre două variabile, regresia multiplă se bazeaza pe corelaţia multiplă dintre variabilele implicate. Dacă în cazul regresiei simple cautăm o linie care să aproximeze cel mai bine distribuţia punctelor de intersecţie pentru doua variabile, în regresia multiplă cautăm o linie care să aproximeze cel mai bine tendinţa norului de puncte al unei distribuţii cu mai multe variabile simultan.
B. Analiza datelor
Statistici descriptive
1. Pentru Rata de angajare pentru femei am obtinut o medie de 58.75 care este mai mica decat 67.95 care reprezinta Rata de angajare pentru barbati.
2. Pentru PIB pe cap de locuitor am obtinut o medie de 19.55.
3. Pentru Cheltuielile cu educatia si cu cercetare si dezvoltare am obtinut o valoare de 5.640, respectiv 1.220 si aceasta valoare este calculata ca procent din PIB.
4. Media Ratei somajului pentru femei este 7.85 si este mai mica decat Rata somajului pentru barbati 9.34.
5. Femeile au o rata de angajare mai mica decat barbatii, dar au o rata mai mica de somaj.
6. Media Importurilor este 53.85 si este mai mare decat cea a Exporturilor 51.85.
Analiza factorială în componente principale
Această tehnică are ca scop determinarea unor noi variabile numite componente principale şi
exprimate sub forma combinaţiilor liniare de varibile originale astfel încat aceste noi combinaţii să aibă o
variabilitate maximă, ceea ce se traduce prin faptul că ele vor aduce un maxim de informaţie posibilă,
fără să existe informaţie redundantă.
Preview document
Conținut arhivă zip
- Analiza Statistica Multidimensionala.docx