Extras din proiect
1. Analiza componentelor principale
Se va lucra pe baza de date „mk marcii.sav”.
Analyze-Dimension Reduction-Factor
La Variables se aleg ca variabile pretul Nike, pretul Puma si pretul Reebok, iar la Selection Variable se alege ca variabila varsta.
La Descriptive se alege “KMO and Bartlett’s test of sphericity” si “coefficients”.
La Extraction se va bifa Unrotated factor solution, Scree plot si Coefficient matrix, iar ca numar fix de factori se alege valoarea 3.
La Options se va bifa Replace with mean (deoarece avem valori lipsa in baza de date, ele fiind inlocuite in acest caz cu media).
Correlation Matrix
Nike Puma Reebok
Correlation Nike 1,000 ,837 ,628
Puma ,837 1,000 ,567
Reebok ,628 ,567 1,000
Din matricea de corelatia=> exista legatura directa puternica intre pretul marcii Nike si a marcii Puma, precum si intre pretul marcii Nike si Reebok; chiar si intre pretul marcii Reebok si Puma existe legatura directa (medie de aceasta data, insa exista) ceea ce inseamna ca cele trei branduri isi influenteaza reciproc pretul la bunurile pe care le comercializeaza.
KMO and Bartlett's Test
Kaiser-Meyer-Olkin Measure of Sampling Adequacy. ,673
Bartlett's Test of Sphericity Approx. Chi-Square 173,567
df 3
Sig. ,000
Se observa ca valoarea KMO=0,673, ceea ce inseamna ca analiza este buna (KMO trebuie sa inregistreze valori de peste 0,5, iar in cazul nostru, valoarea este peste limita). De asemenea si valoarea lui Sig=0,000 ne sugereaza faptul ca analiza este de calitate.
Total Variance Explained
Component Initial Eigenvalues Extraction Sums of Squared Loadings
Total % of Variance Cumulative % Total % of Variance Cumulative %
1 2,362 78,719 78,719 2,362 78,719 78,719
2 ,480 15,988 94,708 ,480 15,988 94,708
3 ,159 5,292 100,000 ,159 5,292 100,000
Extraction Method: Principal Component Analysis.
Total Variance Explained ne arata cat la suta din informatie este retinut de prima variabila si cat de a doua si a treia. In plus, tot acest tabel ne arata cate componente sa retinem.
In cazul nostru, se observa ca prima variabila retine 78,71% din informatie, in timp ce a doua retine doar 16%, iar a treia retine abia 5,2% din informatia (acest lucru ne sugereaza faptul ca ar putea fi scoasa din analiza). Mai mult decat atat, din tabelul „Initial Eigenvalues”, coloana Cumulative se poate observa ca primele doua variabile retin aproape 95% din informatie, ceea ce intareste ideea ca cea de-a treia variabila (pretul Reebok) poate fi scoasa din analiza.
Preview document
Conținut arhivă zip
- Analiza Multivariata a Datelor.docx