Extras din proiect
PROIECT LA ANALIZA DATELOR
I.Analiza în componente principale
Analiza în componente principale urmareşte reducerea dimensiunii matricei in care sunt prezentate datele ce urmează a fi analizate. Deci această tehnică are ca scop reducerea controlată a numărului de variabile (coloane) ale matricei de date, pe cât posibil la doua sau trei. Astfel pe baza informaţiilor despre fiecare judeţ referitoare la 8 variabile, se doreşte ca în loc de 8 variabile corelate între ele să avem doar doua variabile noi, numite componente. Scopul analizei in componenete principale este de a extrage cel mai mic număr de componente care să recupereze cât mai mult din informaţia totală conţinută în datele originale.
Datele necesare efectuării studiului analizei în componenete principale sunt prezentate în tabelul de mai jos:
Regiune Salariu net(ron/salariat) Valoarea impozitelor Drumuri modernizate Decese Nascuţi vii divorţuri căsătorii Suprafaţa spaţiilor verzi
Bacau 718 217 633 2969 3399 946 2812 501
Botosani 618 174 353 1511 2063 454 1320 306
Iasi 703 201 414 3068 4214 429 3218 515
Neamt 603 186 457 1836 2243 864 1787 304
Suceava 639 172 918 2843 3650 741 2511 514
Vaslui 608 161 582 1478 2160 308 1312 285
Braila 622 175 280 2624 2134 687 1475 325
Buzau 639 173 334 1878 2043 418 1426 183
Constanta 780 237 523 4910 4955 748 4005 899
Galati 735 212 285 3101 3025 992 2585 984
Tulcea 652 194 339 986 1203 312 877 75
Vrancea 632 171 347 1162 1559 264 1236 114
Arges 756 223 622 2338 2883 667 2505 401
Calarasi 577 158 514 1247 1416 504 1110 168
Dambovita 714 207 479 1589 1565 447 1213 200
Giurgiu 629 185 381 953 817 122 544 38
Ialomita 635 182 400 1172 1429 255 910 306
Prahova 773 226 523 4682 3931 929 2725 520
Teleorman 669 190 596 1514 1274 294 985 263
Dolj 720 224 498 3527 3569 205 2921 1307
Gorj 871 268 711 1368 1738 313 1276 162
Mehedinti 740 219 406 1311 1315 391 1099 201
Olt 707 213 1135 1728 1871 337 1320 380
Valcea 639 193 634 1549 1856 318 1447 375
Arad 666 195 511 3288 2436 507 1944 305
Caras-Severin 629 167 771 2096 1854 380 1597 427
Hunedoara 761 222 697 3923 3418 1026 2305 811
Timis 750 220 697 4408 3930 819 3612 909
Bihor 629 180 650 3215 3250 472 2249 331
Bistrita-Nasaud 653 180 350 841 1292 214 996 174
Cluj 784 230 597 4550 4334 852 3486 665
Maramures 596 165 537 2981 3505 678 2386 517
Satu Mare 646 172 780 1836 1750 469 1388 225
Salaj 689 182 308 749 1122 147 783 118
Alba 645 182 402 2249 2174 410 1536 270
Brasov 681 221 431 4046 4028 942 3069 352
Covasna 579 153 295 1029 1308 237 722 141
Harghita 617 175 488 1247 1655 239 828 408
Mures 671 190 428 3313 3283 526 2187 508
Sibiu 694 210 383 2886 2813 727 2009 413
Bucuresti 866 274 369 741 777 36 504 230
Ilfov 988 318 90 22073 18539 3083 18431 4139
Exemplul ales se referă la 42 de indivizi,reprezentând judeţele din România, care urmează a fi analizate în funcţie de următoarele variabile :
- Demografice:
- Numărul deceselor din anul 2005 (decese), exprimat în persoane;
- Numărul nascuţilor vii din anul 2005 (născuţi vii), exprimat în persoane;
- Numărul de divorţuri din anul 2005 (divorţuri), exprimat în persoane;
- Numărul căsătoriilor din anul 2005 (căsătorii), exprimat în persoane.
- Economice:
- Salariul net lunar obţinut de un angajat din fiecare judeţ (salariu net), exprimat în Ron;
- Impozitul plătit de un anagajat pe salariul său (valoarea impozitelor), exprimat în Ron;
- Geografice:
- Drumuri modernizate;
- Suprafaţa spaţiilor verzi.
Studiul separat al fiecărei variabile este o fază indispensabilă în procesul de exploatare a datelor dar, totuşi insuficient : într-adevăr , studiul separat al fiecărei variabile lasă deoparte corelaţiile care pot exista între ele , care constituie aspectul cel mai important.
Descriptive Statistics
N Minimum Maximum Sum Mean Std. Deviation Variance
Salariu net
(RON/salariat) 42 577 988 28923 688.64 84.607 7158.284
Valoarea impozitelor
(RON/salariat) 42 153 318 8397 199.93 33.454 1119.190
Drumuri Modernizate 42 90 1135 21148 503.52 191.806 36789.475
Decese 42 741 22073 116815 2781.31 3271.711 10704091.926
Nascuti vii 42 777 18539 117780 2804.29 2714.464 7368313.526
Divorturi 42 36 3083 23709 564.50 478.451 228915.134
Casatorii 42 504 18431 92651 2205.98 2716.947 7381802.268
Suprafata spatiilor verzi 42 38 4139 20269 482.60 636.166 404707.808
Valid N (listwise) 42
Din analiza tabelui care conţine informaţiile despre fiecare variabilă analizată independent observăm faptul că
- variabila “Salariu net” este caracterizată prin media 688,64 şi varianţa 7158,284; salariul net cel mai mare este de 988 Ron , iar cel minim este de 577 Ron;
- variabila “valoarea impozitelor” este caracerizată prin media 199,93 si varianţa 1119,190; impozitul cel mai mare plătit este de 318 Ron , iar cel mai mic este de 153 Ron;
Preview document
Conținut arhivă zip
- Proiect Analiza Datelor.doc