Search for content and authors
 

Metoda taksonomii oparta na modelach mieszanych

Ewa M. Witek 

Akademia Ekonomiczna im. K. Adamieckiego w Katowicach, Katowice 40-287, Poland

Abstract

W ostatnim czasie coraz większą popularnością cieszy się modelowe podejście w taksonomii (model-based clustering). Podejście to zakłada, że obserwacje pochodzą z pewnego skończonego zbioru prostych rozkładów prawdopodobieństwa o nieznanych parametrach. W praktyce najczęściej wykorzystywany jest rozkład normalny. W modelu mieszanym każda zmienna, której prawdopodobieństwa nie znamy przypisana jest odpowiedniej klasie. Problem wyboru najlepszej z metod klasyfikacji i optymalnej liczby klas sprowadza się do wyboru modelu statystycznego o najlepszej jakości dopasowania.

W metodzie taksonomii opartej na modelach mieszanych, wykorzystuje się połączenie hierarchicznej metody aglomeracyjnej opartej na modelach (model-based hierarchical clustering), algorytmu EM oraz statystki BIC. Hierarchiczne metody aglomeracyjne oparte na modelach dokonują podziału zbioru obiektów na klasy. Podział ten ma na celu zainicjowanie algorytmu EM, który daje lepsze wyniki wtedy, gdy znamy wartości startowe, zaś kryterium informacyjne BIC pozwala na wybór właściwej liczby klas.

W części empirycznej referatu metoda taksonomii oparta na modelach mieszanych zostanie porównana z powszechnie stosowanymi metodami taksonomii tj. metodą hierarchiczną oraz metodą k-średnich. Badania przeprowadzone zostaną za pomocą pakietów Mclust i Mclust02 programu komputerowego R.

Literatura:

1. Biernacki, Ch., Celeux, G., Govaert, G., Langrognet, F. (2006), Model- based cluster and discriminant analysis with the MIXMOD software, “Computational Statistics and Data Analysis”, 51, 587-600

2. Fraley, C., and Raftery, A.E. (2002), Model-Based Clustering, Discriminant Analysis, and Density Estimation , “Journal of the American Statistical Association”, 97, 611-631

3. Fraley, C., and Raftery, A.E. (1998), How many clusters? Which Clustering Method? Answers via Model-Based Cluster Analysis, “The Computer Journal”, 41, 577-588.

 

Legal notice
  • Legal notice:
 

Presentation: Oral at XVI KONFERENCJA NAUKOWA SEKCJI KLASYFIKACJI I ANALIZY DANYCH PTS, Sympozjum A, by Ewa M. Witek
See On-line Journal of XVI KONFERENCJA NAUKOWA SEKCJI KLASYFIKACJI I ANALIZY DANYCH PTS

Submitted: 2007-04-14 22:39
Revised:   2009-06-07 00:44