Podręcznik
3. Przykłady zastosowań sieci neuronowych w zadaniach biznesowych
3.1. Wprowadzenie
Zadania rozwiązywane w biznesie należą zwykle do trudnych, odpowiedzialnych finansowo i wymagających najwyższej precyzji. Niezależnie od szczególnej tematyki tych problemów można je zwykle zakwalifikować zarówno do zadań klasyfikacji, aproksymacji jak i predykcji.
Spośród problemów biznesowych należących do zadań klasyfikacyjnych można wymienić między innymi takie jak selekcja firm, których akcje będą zwyżkować, a których tracić na wartości, ocena zdolności kredytowej poszczególnych klientów, ocena niebezpieczeństwa bankructwa firmy, zakwalifikowanie określonych państw do odpowiedniej klasy wiarygodności kredytowej. Typowymi zadaniami predykcji jest przewidywanie wartości akcji poszczególnych firm na giełdzie, przewidywanie poziomu wskaźników giełdowych w poszczególnych dniach (WIG, WIG20), przewidywanie trendu rozwoju gospodarki danego kraju, przewidywanie kursu walut i wiele innych.
Każde z tych zadań ma swoją własną specyfikę. Nawet w ramach tego samego typu zadania należy uwzględnić szczególne uwarunkowania z nim związane. Na przykład przy ocenie zdolności spłaty kredytu przez kredytobiorcę ważne jest czy jest to kredytobiorca w postaci państwa, konkretnej firmy prowadzącej działalność gospodarczą czy osoby prywatnej. W przypadku pożyczek rządowych przy ocenie pożyczkobiorcy ocenia się jego wskaźniki makroekonomiczne, podczas gdy w przypadku firmy jej ogólną wartość, rodzaj produkcji, strategię rozwoju czy zdolności menedżerskie kadry zarządzającej.
Również dane użyte w uczeniu sieci neuronowych będą różnić się zasadniczo dla każdego rodzaju kredytobiorcy. Dla firmy podstawą będą roczne sprawozdania finansowe wskazujące na jej zdolności kredytobiorcze. W przypadku klientów indywidualnych tego typu dane nie występują. W zamian można użyć informacji dotyczącej ich stanu posiadania, zaangażowania finansowego w aktualne inwestycje czy historii ich dotychczasowych kredytów.
Inaczej szacuje się również ryzyko udzielenia kredytu dla różnego rodzaju podmiotów gospodarczych. Można tu wyróżnić kilka rodzajów takich podmiotów: rząd i przedsiębiorstwa sektora publicznego, sektor bankowy, przedsiębiorstwa gospodarcze i klienci indywidualni. Najmniejsze ryzyko odpowiada zwykle pożyczkom rządowym i sektora publicznego, podczas gdy klienci indywidualni są najtrudniejsi we właściwej ocenie tego ryzyka.
Dane używane w rozwiązywaniu problemów biznesowych można podzielić na trzy główne kategorie:
-
Dane ilościowe – są one związane z miarami ilościowymi, możliwymi do bezpośredniego zmierzenia bądź predykcji. Dotyczyć one mogą teraźniejszości, przeszłości lub przewidywań dotyczących przyszłości. Przykładami są roczne wyniki finansowane, stan konta bankowego, bilanse transakcji kredytowych w określonym czasie itp.
-
Dane typu jakościowego – są to dane bezpośrednio niemierzalne dotyczące oceny działalności danego przedsiębiorstwa, w tym ocena kadry zarządzającej i jej umiejętności, ocena sektora gospodarki w którym dane przedsiębiorstwo działa, ocena strategii biznesowej stosowanej dotychczas. Ważna jest również ocena stanu zaplecza technicznego i informatycznego danego przedsiębiorstwa, dająca świadectwo o stanie jego nowoczesności.
-
Dane zewnętrzne – są to informacje uzyskane z instytucji zewnętrznych nie związanych bezpośrednio z danym przedsiębiorstwem, np. dane z urzędu statystycznego, agencji ratingowych, prasy fachowej itp.
Dla uzyskania optymalnych rezultatów każde z zadań biznesowych wymaga odpowiedzi na kilka podstawowych pytań:
-
Jak zdefiniować wielkości wyjściowe aby uzyskać najwyższą efektywność (dokładność) działania sieci neuronowej?
-
Jakie wielkości wejściowe sieci (cechy diagnostyczne) mają największy wpływ na zmienne wyjściowe podlegające estymacji?
-
Jak dokonać selekcji optymalnego zestawu tych cech gwarantującego najlepsze wyniki działania sieci?
-
Jak dobrać rodzaj zastosowanej w rozwiązaniu sieci neuronowej i jak zdefiniować optymalną strukturę takiej sieci?
Każde z tych pytań ma kluczowe znaczenie dla uzyskania jak najlepszych wyników w biznesie. Przykładowo, jeśli zadaniem sieci jest predykcja aktualnego wskaźnika WIG na podstawie obserwowanego trendu z dnia na dzień musimy zdać sobie sprawę ze skali trudności. Przy założeniu, że przeciętny poziom tego wskaźnika zmienia się od 6000 do 6500, przeciętna zmiana tygodniowa w granicach około 50 punktów, odpowiada zmianie względnej równej około 0,8%. Oczywiście aktualne zmiany te mogą być w niektórych tygodniach znacznie większe lub mniejsze. Załóżmy, że akceptowalna dokładność predykcji to około 0,1%, czyli około 6 punktów. Uzyskanie takiej dokładności przy predykcji pełnej wartości tego wskaźnika jest praktycznie niemożliwe ze względu na duże obserwowane wahania dzienne.
Sytuacja zmieni się, jeśli zamiast całkowitej wartości wskaźnika będziemy dokonywać predykcji zmiany jego wartości. W takiej sytuacji dokładność predykcji równa 6 punktów przy założonym zakresie tygodniowych zmian równym 50 punktów odpowiada wymaganej dokładności względnej równej 12%, a więc całkowicie realistycznej w praktyce. Stąd projektując sieć należy nastawić się raczej na predykcję zmian a nie całkowitej wartości prognozowanego poziomu wskaźnika.
Przy prognozowaniu zmian dziennych wskaźnika można wyróżnić znów dwa podejścia do rozwiązania. Pierwsze – to predykcja wartości absolutnych zmian wskaźnika, druga – to predykcja jego zmian względnych odnoszonych do wartości średniej tych zmian z określonego okresu, np. ostatniego tygodnia. W zależności od rodzaju danych jedna lub druga metoda prowadzić będzie do lepszych (dokładniejszych) lub gorszych wyników predykcji. Zwykle jedyną drogą rozstrzygnięcia tego problemu jest przeprowadzenie symulacji obu rodzajów rozwiązań i wybranie tego, który jest dokładniejszy.