pobierz jako PDF


Od MLP do sieci głębokich - tendencje rozwojowe sztucznych sieci neuronowych

Stanisław Osowski

  Referat poświęcony jest przedstawieniu tendencji rozwojowych sztucznych sieci neuronowych. Sieci takie rozwijane od wczesnych lat siedemdziesiątych przeszły długą ewolucję, poczynając od perceptronu wielowarstwowego (MLP), poprzez maszynę wektorów nośnych (SVM), skończywszy na sieciach konwolucyjnych CNN, uważanych aktualnie za najbardziej skuteczne narzędzie przetwarzania danych, zwłaszcza obrazów. Właściwe działanie sieci neuronowych wymaga przejścia dwu głównych etapów: wytworzenia cech diagnostycznych analizowanego procesu, służących jako atrybuty wejściowe dla właściwego rozwiązania sieci działającej w trybie bądź klasyfikatora (sygnały wyjściowe binarne) bądź systemu regresyjnego (sygnały wyjściowe rzeczywisto-liczbowe.

  W klasycznych rozwiązaniach (MLP, SVM) oba te etapy są rozdzielone, przy czym etap generacji cech jest unikalny i wymaga dużej znajomości każdego analizowanego procesu, co stanowi trudność w powszechnym zastosowaniu. Rozwiązanie w postaci CNN jest pozbawione tej wady. Sieć CNN jest wielowarstwowa (kilkadziesiąt warstw), przy czym pierwsze warstwy połączone lokalnie są specjalizowane do automatycznej, nienadzorowanej  generacji i selekcji cech diagnostycznych. Wynik ten jest automatycznie podawany na końcowe warstwy sieci w pełni połączone, które są odpowiedzialne za zadanie końcowej klasyfikacji bądź regresji.

  W ten sposób rola użytkownika zostaje znacznie uproszczona, gdyż na wejście takiej sieci podawane są oryginalne sygnały pomierzone w analizowanym procesie. Dla dalszego  ułatwienia korzysta się zwykle z tzw. „transfer learningu” w którym użytkownik korzysta z gotowej (przygotowanej przez specjalistów) struktury sieci, douczając ją na własnych danych.  W ten sposób sieci CNN zdobyły ogromną popularność w świecie techniki. Powstały liczne rozwiązania sieci prototypowych, które można wykorzystać do takich zadań, jak rozpoznawanie, rekonstrukcja i segmentacja obrazów. Referat dotyczyć będzie w szczególności struktur sieci, algorytmów uczących jak również przeglądu typowych zastosowań tych sieci w szczególności w bioinżynierii, w tym rozpoznawanie i klasyfikacja obrazów mammograficznych, czerniaka, itp.