Arhitectura software pentru data mining

Proiect
9/10 (2 voturi)
Domeniu: Calculatoare
Conține 1 fișier: docx
Pagini : 24 în total
Cuvinte : 7031
Mărime: 330.00KB (arhivat)
Publicat de: Aurora Toader
Puncte necesare: 8

Extras din proiect

Georges Edouard Kouamou,

National Advanced School of Engineering, Cameroon

1. Introducere

Data Mining cunoscut și sub denumirea Knowledge Discovery (,,descoperirea cunoașterii’’) constă în analiza unor cantități mari de date pentru a extrage informații ascunse și predictive. Aceasta este o disciplină care se află la granița dintre inteligența artificială, baze de date, statistică și învățarea automată (machine learning). Întrebările referitoare la ,,descoperirea cunoașterii” prezintă diferite aspecte iar principalele se referă la: clasificarea, gruparea și regulile de asociere. Diverse modele de algoritmi sunt utilizate pentru fiecare aspect: rețele neuronale, structuri lattice, statistici, arbori decizionali, algoritmi genetici (Mephu, 2001).

Tehnic, data mining este procesul prin care se analizeză datele de diferite dimensiunii sau unghiuri, centralizând relațiile identificate. De exemplu, analizând datele de la un punct de vânzare putem obține informații despre ce produse se vând și când. Rezumatul unor astfel de date pe magazin pot fi analizate penru a cunoaște comportamentul consumatorului în cazul unori campani promoționale. Bazându-se pe cunoștințele obținute, un furnizor sau un magazin (vânzator cu amănuntul) poate determina ce produse sunt cele mai potrivite pentru eforturi promoționale. Deși s-au dezvoltat mai multe instrumente în acest scop, putem observa lipsa unor medii software care sunt capabile să vină în sprijinul activității utilizatorilor într-o formă clară pe parcursul procesului de data mining.

Mediul software poate fi privit ca un set de componente care sunt capabile să lucreze prin cooperare. Fiecare componentă oferă servici către alte componente și pot solicita alte servicii de la acestea. Rolul mediului îl constituie coordonarea execuției componentelor pe care le încorporează, cu scopul de a termina sarcinile care îi sunt adresate acestuia. Scopul impus este oferirea de suport pentru procesele din cadrul software-ului adică planificarea diferitelor etape ce descriu obiectivul de atins. În ingineria software acest obiectiv este asociat cu capacitatea de dezvoltare și de evoluție software. În acest caz vorbim despre Software Environment Engineering (SEE) cunoscut ca și instrument CASE. Atunci când mediu software aplicativ este conceput, este specific să includem și data mining, deci aceasta constă într-un set de instrumente construite pentru analiza și oferirea informațiilor potrivite să îmbunătățească soluția persoanelor decidente.

În general mediu software trebuie să se dezvolte și să ia în considerare schimbările și noile cerințe. De exemplu, adăugarea unor instrumente care implică noi funcționalități, înlăturarea sau înlocuirea cu un alt instrument în sistem devine esențială. Aceste modificări nu ar trebui să implice restructurarea consecventă a întregului sistem. De aceea este interesant să reflectăm structura mediului cu scopul de a determina posibilitățile de modularitate și adaptare la contextul acestuia. Modul de evoluție al mediului software este diferit de la viziunea monolitică (unitară) care constă în legătura statica a tuturor elementelor în timpul compilării. Mai multe mecanisme sunt disponibile pentru a implementa acest mod de abordare de construire a mediilor extensibile împreună cu reutilizarea software-ului, în special Design Patterns, arhitecturi software și componente bazate pe dezvoltare.

În acest capitol, suntem interesați de mediul data mining. Scopul acestui studiu este de a descrie o arhitectură software deschisă, care este capabilă de instanțierea prin adăugarea unor componente care implementează diferiți algoritmi, cu scopul de a dezvolta medii pentru ,,descoperirea cunoașterii”. Această arhitectură trebuie să îndeplinească mai multe condiții:

- să ia în considerare varietatea modelelor algoritmice;

- să asigure mecanisme de interoperabilitate între modele;

- să fie integrate cu sistemul informațional existent, deoarece acesta constituie principala sursă de date.

Având în vedere interesul manifestat de mediul afacerilor și de cercetători pentru achiziționarea și/sau dezvoltarea unor astfel de mediii, este necesar să se găsească mijloacele de reducere a eforturilor necesare pentru astfel de cazuri, în special în contextul în care puternice resurse umane lipsesc. Pe parcursul acestui capitol, vom analiza proiectarea unei astfel de arhitecturii generale detaliind posibile soluții care rezolvă condițiile asociate.

2. Problemă

Activitățile din domeniul data mining erau realizate în trecut de către cercetători. Odata cu maturizarea algoritmilor și relevanța problemei care se adresează, producția devine interesată din acest moment de acestă disciplină. În această capitol, vom analiza ce este realizat de alți cercetători și ce de producători.

2.1 Contextul

În domeniul de cercetare, interesul se îndreaptă către dezvoltarea algoritmilor si îmbunătățirea complexității. Instrumentele care rezultă din implementarea acestor algoritmi sunt folosiți separat pe seturi de date indicate și formate destul de simplu, deoarece cercetători rămân în situația de testare a cazurilor academice.

Există eforturi care să reunească aceste instrumente diferite într-un mediu comun. În această privință, experiența de la Universitatea din WAIKATO a creat un mediu omogen, WEKA în termeni limbajului de programare (Witten and Frank, 2005). Cu toate acestea algoritmi trebuie scriși în limbaj de progrmare java pentru a fi integrat pe această platformă. De asemenea mecanismul de interoperabilitate și de schimb al modelelor între instrumente nu este prevăzut.

Preview document

Arhitectura software pentru data mining - Pagina 1
Arhitectura software pentru data mining - Pagina 2
Arhitectura software pentru data mining - Pagina 3
Arhitectura software pentru data mining - Pagina 4
Arhitectura software pentru data mining - Pagina 5
Arhitectura software pentru data mining - Pagina 6
Arhitectura software pentru data mining - Pagina 7
Arhitectura software pentru data mining - Pagina 8
Arhitectura software pentru data mining - Pagina 9
Arhitectura software pentru data mining - Pagina 10
Arhitectura software pentru data mining - Pagina 11
Arhitectura software pentru data mining - Pagina 12
Arhitectura software pentru data mining - Pagina 13
Arhitectura software pentru data mining - Pagina 14
Arhitectura software pentru data mining - Pagina 15
Arhitectura software pentru data mining - Pagina 16
Arhitectura software pentru data mining - Pagina 17
Arhitectura software pentru data mining - Pagina 18
Arhitectura software pentru data mining - Pagina 19
Arhitectura software pentru data mining - Pagina 20
Arhitectura software pentru data mining - Pagina 21
Arhitectura software pentru data mining - Pagina 22
Arhitectura software pentru data mining - Pagina 23
Arhitectura software pentru data mining - Pagina 24

Conținut arhivă zip

  • Arhitectura Software pentru Data Mining.docx

Alții au mai descărcat și

Folosirea metodelor de data mining pentru analiza poluării aerului în Europa

1. Scopul proiectului Poluarea aerului este introducerea chimicalelor, particulelor, materialelor biologice sau a altor materiale nocive in...

Arhitectura calculatoarelor - Intel vs AMD

Rezultatele din testul 3DS Max 7 SPECapc Test Testul alaturat consta in crearea modelelor 3D, modificarea si randarea scripturilor. Conform...

Autentificarea prin semnătură digitală

Introducere O semnatura digitala reprezinta o informatie care il identifica pe expeditorul unui document. Semnatura digitala este creata prin...

Sistem de Prognosticare a Unei Avarii

Acest sistem calculeaza gradul de avariere a unei cladiri în cazul unui cutremur, precum si posibila necesitate a reconstructiei cladirii (partiala...

Te-ar putea interesa și

Aplicație web de raportare pentru cuburi Olap

1. INTRODUCERE In secolul 21, secolul informatiilor si al afacerilor inteligente, organizatiile vor putea sa-si indeplineasca obiectivele, numai...

Proiectare Software-ului Destinat CRM

Definiţie CRM reprezintă o strategie managerială care vizează identificarea principalelor aşteptări şi comportamente ale clienţilor organizaţiei...

Afaceri inteligente

I)Definitii acceptate pentru afacere, afaceri inteligente Termenul de BI (Business Intelligence sau afaceri inteligente) este din ce in ce mai des...

Sisteme Informaționale și Aplicații Informatice

Introducere Secolul XXI cunoaşte o tot mai mare nevoie de simplificare a operaţiunilor necesare a se efectua zilnic, de îndeplinire a tot mai...

Inteligența Competitivă

1. INTRODUCERE Prezentul referat are drept scop lămurirea câtorva noţiuni importante despre „Competitive Intelligence” În prezent, peste 80%...

Analiza Managementului Comercial la SC UTI Group România

INTRODUCERE Noi am ales aceasta tema de proiect ,deoarece Societatea UTI GRUP ROMANIA, prin diviziile sale specializate, oferă soluţii complete...

GVMD

DEPOZITE DE DATE Un depozit de date furnizează o sursă integrată şi centralizată de date, separată de sistemul tranzacţional, care conţine datele...

Analiza Datelor și Extragerea Cunostiintelor

Capitolul 1 REPREZENTĂRI, DESCRIPTORI ŞI METRICI ALE DATELOR MULTIDIMENSIONALE 1.1. Formalizarea noţiunii de variabilă O colecţie de date...

Ai nevoie de altceva?