Data mining în afaceri

Proiect
7/10 (1 vot)
Domeniu: Cibernetică
Conține 1 fișier: docx
Pagini : 51 în total
Cuvinte : 7835
Mărime: 1.64MB (arhivat)
Publicat de: Aleodor Savu
Puncte necesare: 7
Profesor îndrumător / Prezentat Profesorului: Conf.univ. Maer Matei Monica

Cuprins

  1. 1. Analiza componentelor principale 2
  2. 2. Analiza cluster 11
  3. 2.1 Algoritmul ierarhic 11
  4. Soluția 1: Metoda Ward 11
  5. Soluția 2: Metoda complete 12
  6. Soluția cu 3 clase 13
  7. Soluția cu 2 clase 13
  8. 2.2 Alegerea algoritmului de clusterizare 13
  9. 3. Analiza corespondențelor 16
  10. 4. Arbori de clasificare 18
  11. 5. Metode contractuale 22
  12. 6. Algoritmi genetici 31
  13. 7. Analiza Conjoint ( experiment ) 33
  14. 7.1 Se stabilesc caracteristicele și nivelele 33
  15. 7.2 Se generează toate profilele posibile 33
  16. 7.3 Se extrage aleator o parte din profile 33
  17. 7.4 Se transformă chestionarul în R 33
  18. 7.5 Realizăm matricea ce conține: blocul, întrebarea, alternativele și caracteristicile 34

Extras din proiect

1. Analiza componentelor principale3

În această primă parte a proiectului am aplicat analiza componentelor principale (ACP) pe o matrice de date ale cărei coloane sunt descrise în tabelul de mai jos ( tabel 1.1).

Acești indicatori sunt înregistrați pentru 33 de țări și se refera la 4 categorii de indicatori, indicatorii din prima categorie (I1, I2,I3) aleasa, si anume: resurse umane - se refera la studiile (doctorale absolvite, învățământ terțiar) angajaților respectiv la durata acestora, lucru care determina implicit un impact direct asupra gradului de ocupare al forței de muncă (categoria 2 - I4). Cu alte cuvinte, cu cât angajații prezintă studii de ordin superior, cu atât prezintă și un grad de cunoștințe intelectuale mult mai ridicat (categoria 3 - I5, I6) comparativ cu cei care prezintă studii medii/liceale lucru ce impactează în mod direct vânzările (categoria 4 - I7,I8), în sens pozitiv.

Tabel 1.0. Țările indicatorilor analizați

COD INDICATOR DENUMIRE INDICATOR

I1 Absolventi de doctorat la 1000 locuitori;

I2 Ponderea populatiei cu studii superioare (grupa 25-34ani);

I3 Ponderea populatiei care participa la formare;

I4 Ocuparea forței de muncă în activități intensive ale cunoașterii

I5 Numar de brevete;

I6 Numar de marci inregistrate;

I7 Sectoarele inovatoare ale întreprinderilor cu creștere rapidă a forței de muncă;

I8 Vânzări de inovații noi pe piață;

Tabel 1.1. Indicatorii analizați

Primul pas în analiza componentelor principale este investigarea matricii de corelație. Aceasta permite identificarea redundanțelor informaționale și justificarea necesității utilizării acestui tip de analiza. Cei 8 indicatori definiți în tabelul 1.1 fac parte din cele 3 categorii evidențiate mai sus, conform metodologiei European Innovation Scoreboard (EIS) 2018.

Analiza are ca obiectiv obținerea a trei indicatori agregați care să reprezinte fiecare categorie. Am ilustrat această abordare pentru cei 8 indicatori. Conform metodologiei EIS, aceștia reflectă ponderea angajaților care prezintă studii superioare si modul in care impacteaza ocuparea fortei de munca.

Coeficienții de corelație dintre oricare două variabile sunt prezentați în tabelul 1.2.

Tabel 1.2. Matricea de corelație

 Identificăm valori ale coeficienților de corelație care sugerează corelații puternice pozitive: 0.82 ( I5-I3), singura corelație negativă este între indicatorul I5 și I6 ( -0.15). Pentru a decide dacă un coeficient de corelație este diferit de zero din punct de vedere statistic, vom folosi probabilitățile p-value asociate acestora.

Tabel 1.3. Probabilitățile asociate coeficienților de corelație

 De exemplu, coeficientul de corelație dintre I1și I6 , care are valoarea 0.14, nu este semnificativ statistic deoarece probabilitate p-value asociată este 0.44. Cu mici excepții, coeficienții de corelație sunt semnificativi, ceea ce demonstrează utilitatea aplicării ACP.

 Tabelul valorilor p-value prezintă redundanță, ceea ce ne indică faptul că Analiza Componentelor Principale este relevantă.

O modalitate mult mai sugestivă de a vizualiza informațiile din ultimele 2 tabele este reprezentarea unui grafic care include culori pentru a indica intensitatea și semnul coeficientului de corelație.

Preview document

Data mining în afaceri - Pagina 1
Data mining în afaceri - Pagina 2
Data mining în afaceri - Pagina 3
Data mining în afaceri - Pagina 4
Data mining în afaceri - Pagina 5
Data mining în afaceri - Pagina 6
Data mining în afaceri - Pagina 7
Data mining în afaceri - Pagina 8
Data mining în afaceri - Pagina 9
Data mining în afaceri - Pagina 10
Data mining în afaceri - Pagina 11
Data mining în afaceri - Pagina 12
Data mining în afaceri - Pagina 13
Data mining în afaceri - Pagina 14
Data mining în afaceri - Pagina 15
Data mining în afaceri - Pagina 16
Data mining în afaceri - Pagina 17
Data mining în afaceri - Pagina 18
Data mining în afaceri - Pagina 19
Data mining în afaceri - Pagina 20
Data mining în afaceri - Pagina 21
Data mining în afaceri - Pagina 22
Data mining în afaceri - Pagina 23
Data mining în afaceri - Pagina 24
Data mining în afaceri - Pagina 25
Data mining în afaceri - Pagina 26
Data mining în afaceri - Pagina 27
Data mining în afaceri - Pagina 28
Data mining în afaceri - Pagina 29
Data mining în afaceri - Pagina 30
Data mining în afaceri - Pagina 31
Data mining în afaceri - Pagina 32
Data mining în afaceri - Pagina 33
Data mining în afaceri - Pagina 34
Data mining în afaceri - Pagina 35
Data mining în afaceri - Pagina 36
Data mining în afaceri - Pagina 37
Data mining în afaceri - Pagina 38
Data mining în afaceri - Pagina 39
Data mining în afaceri - Pagina 40
Data mining în afaceri - Pagina 41
Data mining în afaceri - Pagina 42
Data mining în afaceri - Pagina 43
Data mining în afaceri - Pagina 44
Data mining în afaceri - Pagina 45
Data mining în afaceri - Pagina 46
Data mining în afaceri - Pagina 47
Data mining în afaceri - Pagina 48
Data mining în afaceri - Pagina 49
Data mining în afaceri - Pagina 50
Data mining în afaceri - Pagina 51
Data mining în afaceri - Pagina 52

Conținut arhivă zip

  • Data mining in afaceri.docx

Alții au mai descărcat și

Tehnologia SSD-urilor

Un solid-state drive (expresie engleză cu traducerea liberă „unitate cu cipuri”; prescurtat SSD) este un dispozitiv de stocare a datelor care...

Cyber attacks - Analiza atacurilor informatice realizate prin e-mail

Abstract Datorită expansiunii internetului și a fluxului de date transmis online din ultimii ani, cele mai numeroase atacuri din secolul XX au...

Metoda Dijkstra

1) Fiecărui nod iÎV i s-a asociat o variabilă d(i) numită în continuare eticheta nodului i. Prin definiție d(s) = 0 . În oricare moment al...

România în mișcare

INTRODUCERE România în mișcare este un proiect care are scop evidențierea necesității sistemelor adaptive complexe în viața unui om. Având în...

BCE - Seminare 1-5

BCE Seminar 1 Sistemele dinamice discrete Clasificare: Un sistem dinamic discret este o secven.a de func.ii yt, care exprima valorile...

Proiectarea arhitecturii sistemelor informatice

Aspecte generale ale proiectării sistemelor informatice - Proiectarea sistemului informatic constă în stabilirea soluțiilor logice și specificarea...

Te-ar putea interesa și

Implementarea unei Interfețe Web pentru o Agenție de Turism

Introducere Lucrarea de faţă are ca şi scop realizarea unui site web pentru o agenţie de turism. Aplicaţia este realizată în ASP.NET, o platformă...

Afaceri Electronice

1.Caracteristicile afacerilor electronice Pentru ca o afacere să supravieţuiască este necesar ca potenţialii ei clienţi să ştie de existenţa...

Simularea Proceselor de Afaceri

I. Introducere Procesele de afaceri sunt o colecţie de unităţi de muncă consecutive, alternative şi paralele cu obiectivul de a crea valoare...

Comerțul electronic

Introducere Lumea se schimbặ. De altfel, s-a schimbat mereu de-a lungul timpului. Astazi, schimbarile sunt si mai rapide datorita evolutiei...

Arhitectura software pentru data mining

Georges Edouard Kouamou, National Advanced School of Engineering, Cameroon 1. Introducere Data Mining cunoscut și sub denumirea Knowledge...

Data Mining - Metodă Modernă de Explorare și Manipulare a Datelor

Introducere Data mining este rezultatul firesc al evoluţiei tehnologiei informaţiei determinat de creşterea volumului de date produs de societatea...

Data mining

Introducere Numarul utilizatorilor de Internet creste in fiecare zi semnificativ, aceasta insemnand faptul ca o buna parte din populatia globului...

Informatica Managerială

Rezumat Managerul de azi pentru a face faţă provocărilor tehnologiilor şi pentru a conduce eficient organizaţia trebuie să cunoască şi să...

Ai nevoie de altceva?