Cuprins
- 1. INTRODUCERE 3
- 2. DESCRIEREA BAZEI DE DATE ȘI A VARIABILELOR ANALIZATE 4
- 3. ANALIZA STATISTICĂ UNIVARIATĂ A DATELOR 5
- 3.1 DESCRIEREA STATISTICĂ A VARIABILELOR CALITATIVE 5
- 3.2. DESCRIEREA STATISTICĂ A VARIABILELOR CANTITATIVE. 7
- 4. ESTIMAREA ȘI TESTAREA STATISTICĂ 12
- 4.1. ESTIMAREA UNEI MEDII PRIN INTERVAL DE ÎNCREDERE. 12
- 4.2. TESTAREA STATISTICĂ 13
- 5. ANALIZA DE REGRESIE ȘI CORELAȚIE 16
- 5.1. ANALIZA DE CERELAȚIE. 16
- 5.2. ANALIZA DE REGRESIE 17
- CONCLUZII 31
Extras din proiect
1. INTRODUCERE
În vederea realizării proiectului, am ales baza de date „GrinnellHouses” , iar sursa acestei baze de date este vincentarelbundock. Scopul acestei analize este de a oferi o imagine de ansamblu asupra vânzării caselor din Grinnell, Iowa în perioada 2005-2015. Aceste observații au fost adunate de la un eșantion de 929 de persoane și prezintă 15 variabile.
Punctul de pornire, în studierea acestui fenomen, a fost alegerea variabilelor cu care voi lucra pe parcursul analizei și anume, variabilele calitative sunt: listprice2 și yearsold2 respectiv bedrooms, baths, saleprice sunt variabilele cantitative.
În capitolele prezentate se vor realiza testări, analize de corelație, regresie, iar în ultima parte a acestui proiect se va realiza testarea ipotezelor statistice.
2. DESCRIEREA BAZEI DE DATE ȘI A VARIABILELOR ANALIZATE
Pentru realizarea acestui proiectului am ales baza de date „GrinnellHouses”
Variabilele din baza de date, prezintă următoarele caracteristici:
- date: este o variabilă de tip numeric și este codul pentru data vânzării;
- adress: este o variabilă de tip string și este adresa unde se află casa;
- bedrooms: este o variabilă numerică și reprezintă numărul de dormitoare;
- baths: variabila numerica și reprezinta numărul de băi;
- squarefeet: este o variabilă de tip numerica și este metrul pătrat al
- lotsize: este o variabilă de tip numerica și reprezintă dimensiunea lotului;
- yearbuilt: este o variabilă numerică și semnifică anul construirii casei;
- yearsold: variabilă numerică și reprezintă anul vânzării casei;
- monthsold: variabilă numerică și reprezintă luna vânzării;
- daysold : variabilă numerică și reprezintă ziua vânzării;
- costpersqft: este o variabilă de tip numeric și este prețul de vânzare pe metrul pătrat;
- origprice: este o variabilă de tip numeric și este prețul inițial;
- listprice: este o variabilă numerică , prețl de listă
- saleprice: este o varibilă numerică, prețul de vânzare al casei
- splppct: este o variabilă numerică
În vederea realizării următoarei analize privind prețul de vânzare a unei case am ales următoarele;
- Variabilele bedrooms și baths= variabile independente
- Variabila saleprice= variabila dependenta
În continuare am ales să creez o variabilă, pornind de la variabilă „listprice” , luând în considerare faptul că prețul de listă variază, le-am grupat astfel : 1 pentru valoarea cea mai mică , 2 și 3 pentru valorile de mijloc , iar 4 pentru cea mai mare valoare.
Preview document
Conținut arhivă zip
- Proiect Pachete Program de Statistica II.docx