Cuprins
- 1. Introducere 2
- 2. Prezentarea bazei de date 3
- 3. Reprezentarea grafică a variabilei răspuns și a unei variabile explicative 4
- 4. Proporțiile condiționate și interpretarea lor 5
- 5. Intervalul de încredere pentru proporție 7
- 6. Testarea independenței dintre două variabile 9
- 7. Riscul relativ 9
- 8. Raportul șanselor 10
- 9. Indicator de asociere 13
- 10. Valoarea aşteptată a lui Y, dată fiind o valoare a lui X 14
- 11. Distribuţia statistică folosită 15
- 12. Ecuaţia modelului de regresie logistică binomial 15
- 13. Transformarea logit 16
- 14. Estimaţiile coeficienţilor din modelul de regresie logistică binomială multiplă 16
- 15. Semnificaţia coeficienţilor pentru variabilele din model 16
- 16. Modelul care conţine doar variabilele semnificative 17
- 17. Modelul care să conţină variabila continuă/variabila calitativă multinomială transformată în variabilă dummy 17
- 18. Intervalele de încredere estimate pentru coeficienții modelului 18
- 19. Sursa datelor 19
Extras din proiect
1. Introducere
Fenomenul ales pentru a efectua prezentul studiu prezintă totalitatea populației inactive cu vârsta de 15 ani și peste, pe categorii de vârstă și nivel de instruire . Scopul acestui studiu este acela de a observa asocierile dintre variabilele incluse în analiză și legăturile dintre acestea, în ce măsură influențează sexul populația inactivă a României, în ceea ce privește vârsta și nivelul de instruire.
Populația inactivă de 15 ani și peste cuprinde persoanele inactive în vârstă de 15 ani și peste. 1996 este anul în care s-a lansat Ancheta forței de muncă în gospodării (AMIGO) care reprezintă sursa datelor.
Începând cu anul 2002, datele nu mai pot fi comparate cu seriile anilor precedenți, pentru că definițiile aplicate au fost revizuite.
Seriile de date pentru perioada 2004-2013 (trimestre și date medii anuale) urmează a fi recalculate în funcție de populația rezidentă reestimată în condiții de comparabilitate cu rezultatele Recensământului Populației și al Locuințelor din anul 2011. Pentru 2014, datele au fost estimate pe baza populației rezidente la data 1 ianuarie din anul de referință și nu sunt comparabile cu seriile de date pentru perioada precedentă până în anul 2003.
2. Prezentarea bazei de date
Baza de date este alcătuită din 63663871 unități statistice.
Definirea variabilelor oferă informații despre definițiile datelor ale variabilelor existente. Informațiile despre definirea variabilelor includ :
- Numele variabilei;
- Tipul datelor : nominal, string, data , etc;
- Variabile descriptive și valoarea etichetelor variabilelor;
- Coduri speciale pentru valorile lipsă;
- Nivel de măsură (măsurare).
Variabilele definite, în număr de 4, sunt prezentate în figura de mai jos:
Caracteristicile variabilelor din baza de date SPSS:
În celulele foii Variable View au fost definite următoarele variabile:
• Variabila Sex, variabilă dummy, dependentă (răspuns), de tip nominal, cu valorile: 0-Masculin, 1-Feminin;
• Variabila Grupa de vârstă, variabilă categorială, independentă (explicativă); de tip nominal, cu valorile: 1- 15-24 de ani, 2- 25-34 de ani,3- 35-49 de ani, 4- 50-64 de ani, 5- 65 de ani ;I peste.
• Variabila Nivel de instruire, variabilă categorială, independentă (explicativă); de tip nominal, cu valorile: 1- Fără școală absolvită, 2- Primar (clasele 1-4), 3- Gimnazial, 4- Liceal, 5- Superior.
• Variabila Număr de persoane, variabilă cantitativă, independentă (explicativă), de tip scală.
Bibliografie
www.insse.ro – de pe acest site a fost preluată baza de date,
Notițele luate în cadrul seminarului disciplinei “Statistica Variabilelor Calitative”,
Tabelele au fost rezultatele prelucrării bazei de date în SPSS.
Preview document
Conținut arhivă zip
- Cercetare asupra populatiei inactive cu varsta de 15 ani si peste, pe categorii de varsta si nivel de instruire.docx