Extras din curs
Capitolul 1
REPREZENTĂRI, DESCRIPTORI ŞI METRICI ALE DATELOR
MULTIDIMENSIONALE
1.1. Formalizarea noţiunii de variabilă
O colecţie de date multidimensionale serveşte la descrierea unei mulţimi Γ de n unităţi observate
(indivizi), cu ajutorul a p variabile.
Fiecare variabilă este definită prin:
1. o mulţime Ω numită spaţiul observaţiilor;
2. o structură algebrică S pe Ω;
3. o aplicaţie v a lui Γ în Ω:
Γ⎯⎯v→Ω înzestrată cu structura S
Pentru ansamblul celor p variabile:
1
Γ⎯⎯v1→Ω înzestrată cu structura S1
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
p
Γ⎯⎯v p→Ω înzestrată cu structura Sp
se poate defini o variabilă vectorială, ce aplică Γ în produsul cartezian Ω1 ×...×Ωp :
( ) v = v1,..., vp : Γ →Ω = Ω1 ×...×Ωp
unde Ω este înzestrată cu o structură S, definită plecând de la S1,..., Sp .
Aşadar, variabila vectorială v asociază fiecărui individ γ ∈Γ , p-uplul (v1(γ ),..., vp (γ )) din Ω.
În funcţie de cardinalul lui Ω şi de structura algebrică S se disting 4 tipuri de variabile:
1° calitative nominale: v :Γ→Ω (≡ N)
unde Ω constituie o mulţime de coduri numerice, finită, fără structură, exceptând relaţia de identitate -
nonidentitate (= sau ≠) impusă de chiar principiul logic al noncontradicţiei. Spre exemplu, parametrului “tip de
transport“, definit prin modalităţile (denominative, nelegate de vreo preferinţă expresă) : rutier=1, feroviar=2,
fluvial=3, maritim=4, aerian=5, i se asociază calitatea nominală: v : Γ→Ω = {1,2,3,4,5}, fără structură.
2° calitative ordinale: v :Γ→Ω (≡ N)
unde Ω este o mulţime finită, sau cel mult numărabilă, înzestrată cu o structură de ordine (≤). Spre exemplu,
testând preferinţele cumpărătorilor cu privire la 4 mărci de parfumuri, li se solicită acestora să acorde o notă de la
1 la 4. Atunci, o variabilă v j asociată mărcii M j , este o aplicaţie v j : Γ →Ω = {1,2,3,4}, înzestrată cu structura
de ordine uzuală, iar o valoare v3(w2 ) = 4∈Ω are semnificaţia că al doilea individ interogat ∈Γ w2 , preferă a
treia marcă de parfum tuturor celorlalte.
2
3° cantitative ordinale: v :Γ→Ω (≡ R)
În acest caz, mulţimea Ω este continuă (reală), înzestrată cu o structură de ordine. Variabila ce se
asociază parametrului temperatură este un bun exemplu în acest sens. La fel variabilele ce exprimă stări, sau
stocuri, ale căror nivele succesive pot fi comparate (≤), de asemenea li se poate aplica operaţia de diferenţă (-),
dar sunt lipsite de sens operaţiile de impărţire (/), sau de însumare (+).
4° cantitative, măsurabile cardinal: v :Γ→Ω (≡ R)
Variabilele de acest tip iau valori într-o mulţime Ω continuă, cu structură de corp ordonat (≤, +, ×).
Exemplele sunt numeroase: venitul lunar, preţul unui produs, conţinutul unui mineral în substanţă utilă, etc.
In funcţie de semnificaţia atribuită, aceluiaşi parametru îi vor corespunde variabile cu structuri diferite.
Astfel, parametrului “vârstă“ i se poate asocia o variabilă cantitativă (vârsta „exactă”), o variabilă cantitativă
ordinală (clasele de vârstă), respectiv o variabilă calitativă nominală (clasele de vârstă regrupate într-o manieră
neordinală, punând, de exemplu, în aceeaşi grupă tinerii şi vârstnicii).
Diferitele tipuri de variabile sunt rezumate în tabelul următor:
Cardinalul
lui Ω
Structura lui Ω
Mulţime continuă Mulţime finită sau cel mult
numărabilă
Fără structură
identitate (=)
nonidentitate (≠)
Domiciliu,
Categorii socio-profesionale
Nominală
Cu structură
ordinară (≤)
Stări, Nivele, Temperatura,
Clase de vârstă
Preferinţe, Ranguri, Frecvenţe,
Asemănări
Ordinală
Cu structură de
corp ordonat
(≤, +, ×)
Venit, Preţ,
Variabile de flux
Măsurabilă
cardinal
Cantitativă Calitativă Variabila
1.2. Reprezentarea datelor multidimensionale. Spaţiul variabilelor şi spaţiul indivizilor
Valorile variabilelor relativ la indivizii supuşi observării se specifică printr-o matrice cu n linii şi p
coloane:
Preview document
Conținut arhivă zip
- 0_Introducere in Data Mining.pdf
- 1_REPREZENTARI, DESCRIPTORI SI METRICI ALE DATELOR MULTIDIMENSIONALE.pdf
- 2_TEHNICI DE INVATARE SUPERVIZATA_discretizoare, algoritmi de inductie si clasificatoare.pdf
- 3_TEHNICI DE INVATARE SUPERVIZATA_Retele neuronale.pdf
- 4_TEHNICI DE INVATARE SUPERVIZATA_Metode predictive_de_tip_regresie.pdf
- 5_TEHNICI DE INVATARE NESUPERVIZATA_Grupare_(clustering).pdf
- 6_TEHNICI DE INVATARE NESUPERVIZATA_reguli_de_asociere.pdf