Extras din proiect
Tabelul pe care l-am utilizat are 42 de inregistrari pentru fiecare judet in parte, referitoare la capacitatea de cazare, capacitatea de cazare in functiune, numarul de sosiri, numarul de inoptari, numarul de unitati cazare si utilizarea neta a capacitatii de functiune pentru anul 2006. Am dorit sa analizez gradul de dezvoltare turistica al fiecarui judet in parte.
Judete CAP_CAZ CAZ_FUNCT SOSIRI INOPTARI UNIT_CAZ UTIL_FUNCT DECIZIE
Bacău mica mica medii medii putine medie I
Botoşani mica mica putine putine foarte_putine mica N
Iaşi mica mica medii medii putine mare I
Neamţ medie medie medii medii medii mica I
Suceava mare mare multe multe multe mica D
Vaslui mica mica putine putine foarte_putine mica N
Brăila mica mica putine putine foarte_putine mare N
Buzău mica mica putine putine putine mica N
Constanţa mare mare multe multe foarte_multe medie D
Galaţi mica mica putine putine foarte_putine medie N
Tulcea medie mica putine putine medii mica N
Vrancea mica mica putine putine putine mica N
Argeş medie medie medii medii medii mica I
Călăraşi mica mica putine putine foarte_putine mare N
Dâmboviţa mica mica putine medii putine medie N
Giurgiu mica mica putine putine foarte_putine medie N
Ialomiţa mica mica putine medii foarte_putine mare N
Prahova mare mare multe multe multe medie D
Teleorman mica mica putine putine foarte_putine mica N
Dolj mica mica putine putine foarte_putine mica N
Gorj mica mica putine putine putine mica N
Mehedinţi mica mica putine putine foarte_putine mica N
Olt mica mica putine putine foarte_putine medie N
Vâlcea mare mare multe multe multe mare D
Arad medie medie medii medii putine medie I
Caraş-Severin mare medie medii multe medii mare I
Hunedoara mica mica putine medii medii medie N
Timiş medie medie multe multe medii medie I
Bihor mare mare multe multe putine mare D
Bistriţa-Năsăud mica mica putine putine foarte_putine medie N
Cluj medie mare multe multe multe mica D
Maramureş mica medie putine putine medii mica N
Satu Mare mica mica putine putine putine mica N
Sălaj mica mica putine putine foarte_putine mica N
Alba mica mica putine putine putine mica N
Braşov mare mare multe multe multe mica D
Covasna mica mica putine medii putine mare N
Harghita medie medie putine putine multe mica N
Mureş medie medie multe multe medii medie I
Sibiu medie medie multe medii medii medie I
Ilfov mica mica putine putine putine mica N
Municipiul Bucureşti mare mare multe multe medii medie I
Figura 1. Datele supuse studiului prin metoda Native Bayes
Am clasificat judetele pe care le-am analizat cu ajutorul metodei Bayes in 3 categorii dupa cum urmeaza:
- N (judet nedezvoltat din punct de vedere turistic);
- I (judet in curs de dezvoltare din punct de vedere turistic);
- D (judet dezvoltat din punct de vedere turistic).
Variabilele independente dupa care am facut analiza sunt urmatoarele:
1. CAP_CAZ (capacitatea de cazare): mica(<=4000), medie(4000-7000), mare(>=7000);
2. CAZ_FUNCT (capacitatea de cazare in functiune): mica(<=1000), medie(1000-2000), mare(>=2000);
3. SOSIRI (numarul de sosiri – mii): putine(<=100), medii(100-200), multe(>=200);
4. INOPTARI (numarul de inoptari – mii): putine(<=300), medii(300-500), multe (>=500);
5. UNIT_CAZ (numarul de unitati de zacare): foarte_putine(<=30), putine(30-100), medii(101-200), multe(201-500), foarte_multe(>500);
6. UTIL_FUNCT (utilizarea neta a capacitatii de functiune): mica(<20%), medie(20%-30%), mare(>40%).
Am importat un fisier TXT care continea aceste date in tabela CAZARE si am facut recodificarea variabilelor astfel:
1. CAP_CAZ : mica - 1, medie - 2, mare - 3;
2. CAZ_FUNCT : mica - 1, medie - 2, mare - 3;
3. SOSIRI : putine - 1, medii – 2, multe – 3;
4. INOPTARI : putine – 1, medii – 2, multe – 3;
5. UNIT_CAZ : foarte_putine – 1, putine – 2, medii – 3, multe – 4, foarte_multe – 5;
6. UTIL_FUNCT : mica – 1, medie – 2, mare – 3.
Deoarece clasificarea Bayesiana este o metoda de clasificare bazata pe formula lui Bayes de calcul a probabilitatii conditionate, in figura de mai jos sunt prezentate probabilitatile estimate asociate perechilor (modalitate variabila independenta - modalitate D variabila tinta).
A fost aleasa valoarea tinta pozitiva - reprezentand una din modalitatile variabilei tinta – si anume valoarea D: (judete dezvoltate din punct de vedere turistic). In functie de aceasta valoare se vor construi graficele ROC si Lift.
Figura 2. Probabilitatile estimate pentru variabile
In Figura 2. este prezentata aprecierea generala a rezultatelor modelului.
Valorile din coloana Probability reprezinta pobabilitatea ca variabila din coloana Attribute Name sa apartina clasei D.
Preview document
Conținut arhivă zip
- Analiza Datelor Privind Gradul de Dezvoltare al Judetelor din Romania din Punct de Vedere al Turismului.doc