Search for content and authors
 

Zastosowanie sztucznych sieci neuronowych do oceny ryzyka kredytowego klienta w telefonii komórkowej

Tomasz Ząbkowski 

Szkoła Główna Gospodarstwa Wiejskiego (SGGW), Nowoursynowska 166, Warszawa 02-787, Poland

Abstract

Artykuł prezentuje przykład zastosowania sztucznych sieci neuronowych do klasyfikacji ryzyka kredytowego klienta telefonii komórkowej. Podstawą budowy modeli neuronowych był zbiór cech charakteryzujących indywidualnych użytkowników, natomiast klasyfikacja została oparta na informacji o rozwiązaniu umowy z klientem z powodu niewypłacalności. Ponadto, w badaniach został wyznaczony model logitowy w celu określenia punktu odniesienia dla trafności klasyfikacji modeli sieci neuronowych.

Dane wykorzystane w eksperymencie stanowiły losową próbkę 51733 klientów operatora telefonii komórkowej. Dla każdego klienta zmienna o nazwie BP jest wykorzystywana do stwierdzenia rozwiązania umowy z powodu braku płatności za dostarczone przez operatora usługi. Zmienna ta jest postaci zero-jedynkowej i przyjmuje wartość 1, jeśli nastąpił brak płatności, oraz 0, w przypadku przeciwnym. W badanej próbie odsetek klientów, u których stwierdzono brak płatności skutkujący rozwiązaniem umowy wynosił 9.33 %. Jako dane charakteryzujące klienta posłużyły zmienne transakcyjne (m.in. płatności, korzystanie z usług głosowych, tekstowych, ponaglenia płatności) oraz demograficzne (m.in. wiek, płeć, miejsce zamieszkania). Z powodu dużej liczby dostępnych zmiennych objaśniających (58), w eksperymencie zdecydowano się na zastosowanie procedury wstępnej eliminacji cech.

Przedstawiony problem oceny ryzyka kredytowego użytkownika telefonii komórkowej sprowadzał się do rozwiązania problemu klasyfikacyjnego, którego celem było przypisanie obiektom przynależności do danej klasy(grupy). W związku, z tym, że znane są wartości klas, z których pochodzą obiekty rozważany był przypadek tzw. uczenia z nauczycielem.

Eksperyment został zapoczątkowany przez zbudowanie modelu logitowego z wszystkimi dostępnymi zmiennymi. Model ten stanowił punkt odniesienia dla trafności klasyfikacji modeli sieci neuronowych. W przypadku sieci neuronowych badanie zostało przeprowadzone w ten sposób, że dla z każdej sieci typu perceptron wielowarstwowy, były tworzone układy z różną ilością neuronów w warstwie ukrytej. Badanie zostało rozpoczęte poprzez utworzenie sieci z 2 neuronami w warstwie ukrytej, a następnie w każdym kolejnym modelu zostały dodawane dodatkowe neurony. Proces został zakończony w momencie, gdy każde następne dodanie neuronów nie poprawiało wyników osiąganych przez ostatnią sieć, bądź też pojawiał się efekt przeuczenia, czyli nadmiernego dopasowania sieci do danych.

Uzyskane wyniki pozwoliły na sformułowanie następujących wniosków:

1) Sztuczne sieci neuronowe w zastosowaniu do klasyfikacji ryzyka kredytowego klienta telefonii komórkowej wydają się być skutecznym narzędziem, które w istotny sposób pozwalają na lepsze zabezpieczenie przychodów.
2) Porównując modele neuronowe z modelem logitowym, otrzymano zbliżony wynik klasyfikacji. Procent poprawnych klasyfikacji wynosił odpowiednio 91.2-91.4% dla sieci oraz 90.6% dla modelu logitowego.
3) Badając trafność modeli w poszczególnych percentylach, poszeregowanych według malejącego prawdopodobieństwa przyjęcia wartości 1 przez zmienną oznaczającą brak płatności (BP), sieciowe modele klasyfikacyjne wykazują przewagę nad modelem logitowym. W tym wypadku różnica w zastosowaniu modelu logitowego wobec modelu neuronowego może sięgać nawet 11 pp. (odpowiednio, 38% wobec 49%), co w istotny sposób przekłada się na trafność klasyfikowania przypadków z dużym poziomem ryzyka, przy jednoczesnym ograniczeniu ponaglania użytkowników dobrych.

 

Legal notice
  • Legal notice:
 

Related papers

Presentation: Oral at XVI KONFERENCJA NAUKOWA SEKCJI KLASYFIKACJI I ANALIZY DANYCH PTS, Sympozjum B, by Tomasz Ząbkowski
See On-line Journal of XVI KONFERENCJA NAUKOWA SEKCJI KLASYFIKACJI I ANALIZY DANYCH PTS

Submitted: 2007-04-12 17:15
Revised:   2009-06-07 00:44