Extras din proiect
Prezentarea variabilelor:
Avem 17 variabile cantitative codificate astfel:
1.CH_PIB cheltuiala cu educatia pentru toate niv. de invatamant ca procent din PIB
2.CH_III cheltuiala cu educatia tertiara ca procent din PIB
3.CH_II chelt cu educ primara,secundara si post secundara nontertiara ca procent din PIB
4.CH_B_III - chelt de baza cu educ tertiara ca procent din PIB
5.CH_A_III - chelt auxiliare(mese, transport etc) cu educ tertiara ca procent din PIB
6.CH_C_III - chelt de cercetare-dezvoltare cu institutiile tertiare ca procent din PIB
7.CH_B_II -chelt de baza pt sect primar,secundar si post secundar nontertiar ca procent din PIB
8.CH_A_II -chelt auxiliare(mese, transport etc) pt sect primar,secundar si postsecundar nontertiar ca procent din PIB
9.CH_P_II - chelt publica cu educ pt sect primar,secundar si postsecundar nontertiar ca procent din PIB
10.CH_P_III - chelt publ cu educ pt sect tertiar ca procent din PIB
11.C_ST_I - chelt medie anuala pe stud in invatam primar($)
12. C_ST_II- chelt medie anuala pe stud in invatam secundar($)
13. C_ST_III- chelt medie anuala pe student in invatam tertiar($)
14. C_ST- chelt medie anuala pe student pt toate ciclurile de invatam($)
15. FD_PB-ponderea fondurilor publice in totalul fondurilor pentru invatamant
16. FD_PB_II-ponderea fondurilor publice in totalul fondurilor pt invatam primar,secundar si postsecundar nontertiar
17. FD_PBIII- ponderea fondurilor publice in totalul fondurilor pt invatamantul tertiar
Indivizii sunt cele 32 de tari.
Analiza in Componente Principale
Scopul acestei analize este acela de a extrage cel mai mic numar de componente(variabile noi) care sa recupereze cât mai mult din informatia totala continuta în datele originale.
Vom efectua Analiza in Componente Principale pe datele standardizate,deoarece ordinul de marime al datelor din tabel este foarte diferit.
Pentru standardizarea variabilelor folosim modulul Data Management cu optiunea Standardize Variables al softului statistic Statistica. Obtinem astfel urm. tabel standardizat:
A.Urmatorul pas este calculul matricei de corelatii ai carei vectori proprii sunt noile variabile(componentele principale)
Din tabelul de mai sus putem observa cuplurile de variabile puternic correlate:
-CH_PIB cu CH_II(0.82),CH_B_II(0.75) si cu CH_P_II(0.77)
-CH_III cu CH_B_III(0.93) si cu C_ST_III(0.67)
-C_ST_I cu C_ST_II(0.89) si cu C_ST(0.90)
-FD_PB cu FD_PB_II(0.77) si cu FD_PB_III(0.94)
B. Apoi vom calcula valorile proprii ce ne arata cantitatea de informatie extrasa de fiecare componenta principala si care este de natura variatiei( )in cazul ACP in spatiul indivizilor,in timp ce in cazul ACP in spatiul variabilelor este de natura corelatiei( ).
Unde am notat cu componenta principala de ordinul k si cu valoarea proprie corespunzatoare acesteia.
-In prima coloana a tabelului de mai sus avem valorile proprii ce exprima varianta explicata prin fiecare noua axa(respectiv componenta principala),dar si corelatia dintre variabila noua Ck si variabilele vechi este:
-In a doua coloana a tabelului avem importanta fiecarei noi axe,sau altfel spus procentul din inertia totala a norului de puncte retinut de fiecare axa.( ak/m)
-In a patra coloana avem importanta primelor k axe .
De exemplu varianta componentei principale 1 este egala cu valoarea proprie 6.579407 si retine 38.7% din varianta totala.
Varianta componentei principale 2 este egala cu valoarea proprie 5.81757 si retine 22.56% din varianta totala.
Aceste doua axe formeaza primul plan principal care explica 61.26% din inertia totala a norului de puncte.
Primele 4 axe,ce au valorile proprii supraunitare, explica peste 80% din inertia totala a norului de puncte.
In graficul valorilor proprii avem valorile proprii in functie de numarul lor de ordine.
Se observa si din grafic cele mai importante valori proprii,cele supraunitare.Deoarece se observa o descrestere brusca de la valoarea proprie 1 la valoarea proprie 2 si apoi la valoarea proprie 3,putem afirma si pe baza graficului ca primele 3 valori proprii sunt cele mai semnificative si explica o mare parte din inertia norului de puncte.
Preview document
Conținut arhivă zip
- Analiza Datelor in Profil Teritorial.doc