Search for content and authors |
Wykorzystanie pewnego kryterium przy budowie drzewa klasyfikacyjnego dla zbioru obiektów symbolicznych |
Małgorzata Gliwa |
Akademia Ekonomiczna im. K. Adamieckiego w Katowicach, Katowice 40-287, Poland |
Abstract |
Proces rekurencyjnego podziału zbioru obiektów symbolicznych na podzbiory aż do uzyskania ich jednorodności ze względu na przynależność do K klas to tworzenie drzewa klasyfikacyjnego. Efektywność tworzenia drzew zależy jednak od sposobu podziału zbioru obiektów symbolicznych w węzłach drzewa. W każdym kroku algorytmu należy wskazać tę cechę, która daje dwa najbardziej różniące się podzbiory. M. Vrac i E. Diday zaproponowali nowe kryterium, w którym postulują, aby wyboru tego dokonywać optymalizując równocześnie kryterium homogeniczności (H(W), W- węzeł drzewa) i kryterium zróżnicowania (D(W)). Takie podejście wykorzystuje jednocześnie uczenie z nauczycielem i bez nauczyciela. Otrzymane w wyniku podziału klasy obiektów symbolicznych można opisywać, tj. wskazywać cechy charakterystyczne dla danej klasy. Kontynuując rozważania z poprzednich Konferencji SKAD dotyczące analizy danych symbolicznych, w referacie przedstawione zostanie kryterium pozwalające na optymalny wybór cechy w oparciu, o którą nastąpi podział zbioru obiektów symbolicznych. Polega ona maksymalizacji funkcji ΔQ(W), gdzie: maxΔQ(W)=max[αΔH(W)+βΔD(W)], α+β=1. Funkcja D(W) najczęściej wyrażana jest przez wskaźnik zróżnicowania Giniego, natomiast omówione zostaną rożne postaci funkcji H(W) w zależności od rodzaju zmiennych, którymi opisany jest obiekt symboliczny. Jako podsumowanie zaprezentowany zostanie przykład obliczeniowy. Literatura:
|
Legal notice |
|
Presentation: Oral at XVI KONFERENCJA NAUKOWA SEKCJI KLASYFIKACJI I ANALIZY DANYCH PTS, Sympozjum A, by Małgorzata GliwaSee On-line Journal of XVI KONFERENCJA NAUKOWA SEKCJI KLASYFIKACJI I ANALIZY DANYCH PTS Submitted: 2007-04-15 13:07 Revised: 2009-06-07 00:44 |