Cuprins
- Capitolul 1. Introducere 3
- Capitolul 2. Descrierea bazei de date și a variabilelor analizate 4
- Capitolul 3. Analiza statistică univariată a datelor 7
- 3.1.Descrierea statistică a variabilelor calitative 7
- 3.2. Descrierea statistică a variabilelor cantitative 9
- Capitolul 4. Estimarea și testarea statistică 13
- 4.1. Estimarea unei medii prin interval de încredere 13
- 4.1.1. Estimarea prin interval de încredere unei medii 13
- 4.1.2. Estimarea prin interval de încredere a diferenței dintre două medii: 13
- 4.2 Testarea statistică 14
- 4.2.1. Testarea normalității unei variabile 14
- 4.2.2. Testarea unei medii 15
- 4.2.3. Testarea unei proporții 16
- 4.2.4. Testarea diferenței dintre două medii și două (sau mai multe) proporții 17
- 4.2.5. Testarea asocierii dintre două variabile 20
- 4.2.6. Testare ANOVA 21
- Capitolul 5. Analiza de regresie și corelație 23
- 5.1. Analiza de corelație 23
- 5.2. Analiza de regresie 25
- 5.2.1. Regresia liniară simplă 25
- 5.2.2. Regresie liniară multiplă 27
- 5.2.3. Regresia neliniară 30
- 5.3. Testarea ipotezelor clasice ale modelului de regresie 32
- Capitolul 6. Concluzii 38
- Bibliografie 39
Extras din proiect
Capitolul 1. Introducere
Acest proiect analizează o bază de date prin intermediul programului de prelucrare de date SPSS. Baza de date analizată este health-costs.sav și este preluată din colecția de baze oferite de IBM.com.
Baza de date urmărește nivelul costului sănătății în cazul persoanelor vârstnice și factorii de influență a acestuia. Baza de date acoperă un eșantion de 525 de respondenți situați în SUA în anul 2020.
Capitolul următor prezintă variabilele analizate și descrie baza de date. Capitolul 3 are în prim plan o analiză univariată a datelor, iar capitolul4 dezvoltă estimarea și testarea statistică pe baza datelor . În final, capitolul 5 prezintă o analiză de regresie și corelație.
Scopul proiectului este de a afla cât de mult este influențat costul sănătății de factori precum consumul de alcool, consumul de țigări si vârsta.
Capitolul 2. Descrierea bazei de date și a variabilelor analizate
Baza de date folosită este health-costs.sav și este preluată din colecția de baze oferite de IBM.com. Aceasta conține 525 înregistrări și 10 variabile. Proiectul se axează pe 5 variabile, trei numerice și două nenumerice.
Variabile numerice:
- Costs (“Total Health Care Costs Declared over 2020”) - variabilă scalară ce reprezintă costul total
- Age (“Age at Survey Completion (Years) “) - variabilă scalară, reprezintă vârsta respondenților
- Alco (“Average Consumption of Alcoholic Beverages per Week “) - variabilă scalară ce reprezintă consumul mediu de alcool pe săptămână
Variabile nenumerice:
- Sex (“Sex“) - variabiă nominală, ce reprezintă sexul persoanei astfel: 0- “Female“, 1- “Male“
- Cigs2 (“Smoker?“) - variabilă nominală, ce reprezintă statusul de fumător al persoanei și este definită astfel: 1-“Nonsmoker“, 2- “Average Smoker“, 3- “Heavy Smoker“.
Pentru a afișa informații despre baza de date vom accesa următoarea cale de acces din SPSS: Fille/Display Data File Information/Working File.
Bibliografie
- Cursul Pachete program statistică I, anul 2021-2022
- Seminarele Pachete program statistică I
- www.IBM.com
Preview document
Conținut arhivă zip
- Pachete program statistica II.docx