Cuprins
- 1.Introducere 2
- 2.Descrierea bazei de date și a variabilelor analizate 2
- 3.Analiza statistică univariată a datelor 3
- 3.1.Descrierea statistică a variabilelor calitative 3
- 3.2.Descrierea statistică a variabilelor cantitative 6
- 4. Analiza de regresie și corelație 8
- 4.1. Analiza de corelație 8
- 4.2. Analiza de regresie 10
- Regresia liniară simplă 10
- Regresia liniară multiplă 11
- Regresia simplă neliniară 12
- 5. Estimare și testare statistică 15
- 5.1. Estimarea unei medii prin interval de încredere 15
- 5.1.1. Estimarea prin interval de încredere a unei medii 15
- 5.1.2. Estimarea prin interval de încredere a diferenței dintre doua medii 16
- 5.2. Testare statistică 16
- 5.2.1.Testarea unei medii 16
- 5.2.2.Testarea unei propoții 17
- 5.2.3. Testarea diferenței dintre doua medii și doua proporții 18
- 5.2.4. Testarea asocierii dintre doua variabile 19
- 5.2.5. ANOVA 21
- 5.3. Testarea ipotezelor clasice ale modelului de regresie 22
- 6. Concluzie 29
Extras din proiect
1.Introducere
Programul SPSS este unul dintre cele mai utilizate în analiza statistică a datelor, mai ales pentru cei începători de a lucre cu datele. Cu ajutorul acestui program am realizat analiza datelor din baza de date insurance_claims.sav.
2.Descrierea bazei de date și a variabilelor analizate
Va voi prezenta baza de date aleasă de mine, aceasta fiind: insurance_claims.sav. Prin intermediul acestei baze de date, voi realiza cu ajutorul testării și estimării, corelații reprezentative folosind metodele specifice.
După recodificarea variabilei reside am obținut noua variabila reside_cat ca variabilă ”string” și Label: ”Tip de familie”, având în „Values” următoarele valori : „<3 => Mică”, „3-5 => Medie”, „5-7 => Mare”, „>7 => Extinsă”.
3.Analiza statistică univariată a datelor
3.1.Descrierea statistică a variabilelor calitative
Pentru a descrie aceste variabile se vor urma pașii : Analyse-Descriptive statistics-Frequencies (urmând să bifăm ceea ce dorim din opțiunea “ Statistics”)
FREQUENCIES VARIABLES=claim_type gender edcat
/STATISTICS=STDDEV VARIANCE RANGE MINIMUM MAXIMUM MEAN MEDIAN MODE SUM SKEWNESS SESKEW KURTOSIS
SEKURT
/HISTOGRAM NORMAL
/ORDER=ANALYSIS.
Statistics
Type of claim Gender Level of education
N Valid 4415 4415 4415
Missing 0 0 0
Mean 3,06 ,51 2,70
Std. Error of Mean ,023 ,008 ,018
Median 3,00 1,00 3,00
Mode 5 1 2
Variance 2,355 ,250 1,419
Skewness -,006 -,029 ,237
Std. Error of Skewness ,037 ,037 ,037
Kurtosis -1,433 -2,000 -,965
Std. Error of Kurtosis ,074 ,074 ,074
Range 4 1 4
Minimum 1 0 1
Maximum 5 1 5
Sum 13496 2240 11903
Percentiles 25 2,00 ,00 2,00
50 3,00 1,00 3,00
75 5,00 1,00 4,00
Type of claim
Frequency Percent Valid Percent Cumulative Percent
Valid Wind/Hail 1054 23,9 23,9 23,9
Water damage 627 14,2 14,2 38,1
Fire/Smoke 1039 23,5 23,5 61,6
Contamination 404 9,2 9,2 70,8
Theft/Vandalism 1291 29,2 29,2 100,0
Total 4415 100,0 100,0
Gender
Frequency Percent Valid Percent Cumulative Percent
Valid Male 2175 49,3 49,3 49,3
Female 2240 50,7 50,7 100,0
Total 4415 100,0 100,0
Level of education
Frequency Percent Valid Percent Cumulative Percent
Valid Did not complete high school 760 17,2 17,2 17,2
High school degree 1422 32,2 32,2 49,4
Some college 938 21,2 21,2 70,7
College degree 990 22,4 22,4 93,1
Post-undergraduate degree 305 6,9 6,9 100,0
Total 4415 100,0 100,0
Preview document
Conținut arhivă zip
- Proiect SPSS.docx