Search for content and authors
 

Wykorzystanie pewnego kryterium przy budowie drzewa klasyfikacyjnego dla zbioru obiektów symbolicznych

Małgorzata Gliwa 

Akademia Ekonomiczna im. K. Adamieckiego w Katowicach, Katowice 40-287, Poland

Abstract

Proces rekurencyjnego podziału zbioru obiektów symbolicznych na podzbiory aż do uzyskania ich jednorodności ze względu na przynależność do K klas to tworzenie drzewa klasyfikacyjnego. Efektywność tworzenia drzew zależy jednak od sposobu podziału zbioru obiektów symbolicznych w węzłach drzewa. W każdym kroku algorytmu należy wskazać tę cechę, która daje dwa najbardziej różniące się podzbiory. M. Vrac i E. Diday zaproponowali nowe kryterium, w którym postulują, aby wyboru tego dokonywać optymalizując równocześnie kryterium homogeniczności (H(W), W- węzeł drzewa) i kryterium zróżnicowania (D(W)). Takie podejście wykorzystuje jednocześnie uczenie z nauczycielem i bez nauczyciela. Otrzymane w wyniku podziału klasy obiektów symbolicznych można opisywać, tj. wskazywać cechy charakterystyczne dla danej klasy.

Kontynuując rozważania z poprzednich Konferencji SKAD dotyczące analizy danych symbolicznych, w referacie przedstawione zostanie kryterium pozwalające na optymalny wybór cechy w oparciu, o którą nastąpi podział zbioru obiektów symbolicznych. Polega ona maksymalizacji funkcji ΔQ(W), gdzie:

maxΔQ(W)=max[αΔH(W)+βΔD(W)], α+β=1.

Funkcja D(W) najczęściej wyrażana jest przez wskaźnik zróżnicowania Giniego, natomiast omówione zostaną rożne postaci funkcji H(W) w zależności od rodzaju zmiennych, którymi opisany jest obiekt symboliczny. Jako podsumowanie zaprezentowany zostanie przykład obliczeniowy.

Literatura:

  1. Bock H.H., Diday E., Analysis of Symbolic Data, Springer-Verlag, Berlin 2000.
  2. Breiman L., Friedman J.H., Olshen R. A., Stone C. J., Classification and regression trees, Wadsworth, Belmont 1984.
  3. Limam M. M., Diday E., Winsberg S., Symbolic Class Description with Interval Data, Journal of Symbolic Data Analysis, t.1, 2004.
  4. Quinlan J. R., Induction of Decision Trees, Machine Learning, t. 1, 1986.
  5. Vrac M., Diday E., Winsberg S., Limam M. M., Symbolic class description, [w:] Jajuga K. (red.), Classification, Clustering and Data Analysis, Springer-Verlag, Heidelberg 2002.
 

Legal notice
  • Legal notice:
 

Presentation: Oral at XVI KONFERENCJA NAUKOWA SEKCJI KLASYFIKACJI I ANALIZY DANYCH PTS, Sympozjum A, by Małgorzata Gliwa
See On-line Journal of XVI KONFERENCJA NAUKOWA SEKCJI KLASYFIKACJI I ANALIZY DANYCH PTS

Submitted: 2007-04-15 13:07
Revised:   2009-06-07 00:44