Implementacja i wykorzystanie wielowarstwowej sieci perceptronowej w modelowaniu makroekonomicznym

Spis treści
Strona domowa


Wstęp

Powszechne wykorzystanie komputerów oraz coraz liczniejsze stosowanie metod sztucznej inteligencji jest jednym z głównych czynników wzrostu gospodarczego w krajach wysoko rozwiniętych. Nowe systemy komputerowe coraz szerzej wkraczają na obszary zarezerwowane do niedawna wyłącznie dla ludzkiej inteligencji, znajdują zastosowanie praktycznie w każdej dziedzinie, od robotyki przez zarządzenie aż do medycyny lub geologii. Dostępność sprzętu kompletowego, opracowanie efektywnych metod programowania oraz bogactwo pomysłów i koncepcji, otwiera nowe potężne możliwości w zakresie złożonego przetwarzania danych, gromadzenia i wykorzystywania wiedzy, symulacji, modelowania i optymalizacji, przesuwając nawet punkt zainteresowania od badań ogólnych nad sztuczną inteligencją w kierunku poszukiwania nowych obszarów zastosowań i implementacji.

Dziedziną szczególnie dynamicznie rozwijającą się w ostatnim okresie są sztuczne sieci neuronowe. Swoją popularność zawdzięczają przede wszystkim ogromnym możliwościom modelowania dowolnie złożonych i nieliniowych odwzorowań. Są one przy tym narzędziem bardzo wygodnym, nie wymagającym od użytkownika wyrafinowanej wiedzy odnośnie szczegółowych warunków i założeń. Posiadają ponadto zdobność do samoprogramowania się w procesie uczenia, a ogromna ilość udanych zastosowań w najróżniejszych zagadnieniach i dziedzinach świadczy o permanentnym i ciągle wzrastającym zainteresowaniu.

Zagadnienia ekonomiczne, obok problemów technicznych, są głównym obszarem wykorzystywania obliczeń neuronowych. Przez długi czas najpopularniejszą techniką badania i odzwierciedlania zjawisk gospodarczych było modelowanie liniowe. Zjawiska społeczno-ekonomiczne należą jednak do wydatkowo skomplikowanych i niejawnych, a procesy zachodzące w gospodarce mają z reguły charakter wysoce nieliniowy i trudny do przedstawienia w postaci równań matematycznych. Modelowanie zależności gospodarczych, szczególnie w skali makroekonomicznej, wydaje się więc być naturalnym obszarem zastosowania sztucznych sieci neuronowych, których właściwości powinny doskonale odpowiadać opisanym warunkom.

Celem niniejszej pracy jest przeanalizowanie metody sztucznej inteligencji, określanej jako wielowarstwowe sieci perceptronowe pod kątem zastosowania i implementacji w modelowaniu makroekonomicznym. Analiza zagadnienia wychodzi od poszukiwania optymalnych metod odpowiadających charakterowi modelowanej dziedziny oraz specyfice dostępnych danych, które najczęściej występują w postaci nielicznych i silnie zaburzonych losowo obserwacji. Praca podejmuje próbę określenia najbardziej odpowiednich i efektywnych mechanizmów, potencjalnych obszarów trudności i niepowodzeń oraz sposobów ich unikania. Ze względu na niezwykle złożony charakter obliczeń neuronowych jedynym sposobem wdrożenia efektów analiz teoretycznych jest samodzielne oprogramowanie systemu komputerowego, symulującego struktury sieci neuronowych oraz implementującego procedury ich optymalizacji. Zwieńczeniem celu stawianego przed praca jest praktyczna weryfikacja wysuwanych wniosków i działania aplikacji w postaci zbudowania neuronowej wersji istniejącego modelu makroekonomicznego.

Praca składa się z pięciu rozdziałów. Rozdział I stanowi wprowadzenie i przegląd metod sztucznej inteligencji. Starano się w przedstawić sieci neuronowe w kontekście szerszej dziedziny wiedzy oraz ukazać aktualne kierunki badań. Prezentacja innych technik sztucznej inteligencji jest szczególnie istotna w obliczu współczesnych tendencji do tworzenia systemów hybrydowych, w których sieci neuronowe łączone są z innymi rozwiązaniami.

W rozdziale II zaprezentowano podstawowe problemy oraz aktualny stan wiedzy w zakresie najpopularniejszej odmiany struktur neuronowych i głównego przedmiotu zainteresowania pracy, czyli jednokierunkowych, wielowarstwowych sieci perceptronowych.

Rozdział III szczegółowo analizuje podstawowe zalecenia i algorytmy pod kątem trafności w modelowaniu makroekonomicznym. Zawiera wybór i propozycje optymalnych rozwiązań, które stanowią teoretyczny punkt wyjścia przy dalszym oprogramowaniu aplikacji sieci neuronowej i algorytmów jej uczenia.

Treść rozdziały IV obejmuje opis struktury i głównych założeń budowanej aplikacji neuronowej, a szczególnie efektywność i możliwości jakie wynikają z wykorzystania jeżyka programowania zorientowanego obiektowo oraz wzorców projektowych. W tekście zwraca się ponadto uwagę na dążenie do uniwersalności programu oraz jego dalszej rozbudowy.

Ostatni, V rozdział, prezentuje neuronową wersję modelu gospodarki szwedzkiej o nazwie EMIL. Na przykładzie jego budowy podjęto próbę analizy różnic pomiędzy etapami tworzenia tradycyjnego modelu ekonometrycznego i modelu neuronowego. Całość zakończona jest prezentacją wyników uzyskanych w modelowaniu za pomocą sieci neuronowych, a szczególnie analizą przydatnością wykorzystanych metod trenowania i obróbki danych.

Zakres i charakter tematu pracy wymusił wykorzystanie wiedzy i zasobów z różnych dziedzin, do których należą ekonomia, informatyka, statystyka i matematyka. Głównym źródłem informacji o aktualnym stanie badań i współczesnych tendencjach w obszarze sztucznych sieci neuronowych okazał się zbiór tekstów: Neural Network FAQ (newsgroup comp.ai.neural-nets), ed. W. S. Sarle, SAS Institute, 1997 - 2002. Obszernej syntezy wiedzy na wymieniony temat dostarczyła także praca zbiorowa pod redakcją W. Ducha, J. Korbicza, L. Rutkowskiego, R Tadeusiewicza pt. Biocybernetyka I inżynieria biomedyczna 2000, pod red. M. Nałęcza, t. VI, Sieci neuronowe, Akademicka Oficyna Wydawnicza EXIT.

Cenną pozycją w ogólnym przeglądzie dziedzin sztucznej inteligencji oraz współczesnych systemów hybrydowych, jak również źródłem przykładów konkretnych zastosowań była praca zbiorowa autorstwa: J. S. Zielińskiego (red.), W. Bartkiewicza, R. Czajki, Z. Gontara, B. Jęczkowskiej, A. Pamuły pt. Inteligentne systemy w zarządzaniu, Wydawnictwo Naukowe PWN.

Istotnym opracowaniem przedstawiającym sieci neuronowe w kontekście modelowania ekonomicznego była praca pod redakcją J. Siedleckiego zatytułowana: Wykorzystanie sztucznych sieci neuronowych w modelowaniu ekonomicznym, Wydawnictwo Akademii Ekonomicznej im. Oskara Langego we Wrocławiu.

Interesującą pozycją osadzoną w kontekście zagadnień gospodarczych i zawierającą porównanie obliczeń neuronowych w stosunku do metod statystycznych okazało się opracowanie: J. B. Gajda, Prognozowanie i symulacja a decyzje gospodarcze, Wydawnictwo C. H. Beck.

W rozdziale zajmującym się budową aplikacji neuronowej skorzystano przede wszystkim z fundamentalnej książki B. Eckela dotyczącej języka Java pt. Thinking in Java. Edycja polska. Wprowadzenie do programowania zorientowanego obiektowo w sieci WWW, Wydawnictwo Helion, w oraz z pozycji J. W. Coopera poświęconej wzorcom projektowym: Java. Wzorce projektowe, Wydawnictwo Helion.

Wykorzystany w ostatnim rozdziale model gospodarki szwedzkiej o nazwie EMIL oraz dane makroekonomiczne użyte podczas trenowania sieci neuronowych w całości zaczerpnięto z pracy: J. B. Gajda, C. H. Gustafson, EMIL - An Econometric Macro Model of Sweden, Department of Economics, Örebro University, Working paper no.7.

Wszystkie obliczenia neuronowe wykonano za pomocą opisanego w pracy programu komputerowego o roboczej nazwie NeuralEngine. Aplikacja została napisana w języku Java, przy użyciu środowiska programistycznego na licencji Open Source o nazwie Eclipse v2.1.1.

Obfitość zagadnień i szczegółów na jakie napotyka się w procesie budowy systemu sieci neuronowej, ciągły dynamiczny rozwój nowych metod oraz krzyżowanie się wiedzy z różnych dziedzin narzuciły pewne ograniczenia podczas analizy postawionego zagadnienia. Posiadam jednak nadzieję, że poniższa praca może stanowić kolejny głos w dyskusji nad wykorzystaniem sztucznych sieci neuronowych w problemach modelowana ekonomicznego.


Strona domowa
Spis treści
Dalej


Copyright © by Paweł Rośczak, 2003