Extras din referat
Exercițiu propus
Realizați o documentație a funcțiilor kmeans și fitgmdist din Matlab care să cuprindă o
descriere a funcționalităților, prezentarea argumentelor de intrare și de ieșire, informații despre
algoritmul care stă la baza implementării, precum și diverse exemple de rulare și afișare a datelor,
pe alte seturi de date, chiar de dimensiuni mai mari.
Rezolvare
Funcția k-means:
Funcția k-means este un algoritm de grupare a datelor. În MATLAB aceasta se apelează
sub una din aceste forme :
fig. 1
Această funcție returnează un vector de indici, unde fiecare indice reprezintă cărui grup îi
aparține punctul de la poziția identică din setul de date (X, in ex. de mai sus).
Tehnica de inițializare a centrelor poate fi aleasă de către programator (vizual sau
matematic). Una dintre tehnicile eficiente de inițializare a centrelor este tehnica k-means++ care
va alege ca și centru elemente din mulțimea datelor de intrare, urmând ca acestea să fie
recalculate dupa o serie de operatii matematice.
Cel mai important parametru, care stă la baza algoritmului este numărul centrelor, acesta
trebuie ales de către programator, acesta având responsabilitatea de a analiza datele pentru
alegerea unui număr optim de centre. Numărul de centre ar trebui să fie mai mic sau egal cu
numărul natural de grupuri pentru a obține o grupare cât mai eficientă.
După cum se poate observa și în figura 1, această funcție poate avea mai mulți sau mai
puțini parametri de intrare sau de ieșire, numărul acestora depinzând de preferințele
programatorului.
Parametrii de intrare :
- X -setul de date, specificate sub formă de matrice numerică (tipul de dată fiind single
sau double); rândurile lui X corespund observațiilor și coloanele corespund
variabilelor.
- k - numărul de centre, specificat ca număr întreg pozitiv.
- Name, Value - perechi de atribute adiționale pentru a specifica diferite opțiuni oferite
de această funcție; valorile posibile sunt acestea:
Bibliografie
1. Lucrare laborator 1 Tehnica k-means (k-medii) pentru probleme de grupare, M.-B. Radac, 2019,
UPT
2. https://www.mathworks.com/help/stats/kmeans.html
Preview document
Conținut arhivă zip
- Tehnica k-means pentru probleme de grupare.pdf