Jak przewidzieć nieprzewidziane? Powstał przegląd metod do wykrywania anomalii danych szeregów czasowych
Monitorowanie bezpieczeństwa finansowego, bezpieczeństwa przemysłowego, warunków medycznych, klimatu i zanieczyszczeń wymaga analizy dużych ilości szeregów czasowych. Kluczowym krokiem w tej analizie jest identyfikacja nietypowych punktów, wzorców lub zdarzeń, które odbiegają od zbioru danych. Jest to znane jako „wykrywanie anomalii” i jest wykonywane przy użyciu technik eksploracji danych. Chociaż metody głębokiego uczenia się były szeroko stosowane w wykrywaniu anomalii, nie ma jednej uniwersalnej techniki, która sprawdzałaby się w wielu zastosowaniach w różnych dziedzinach. Co więcej, istniejące badania dotyczące wykrywania anomalii dla wielowymiarowych szeregów czasowych skupiają się wyłącznie na podejściu bez badania jego wyzwań.
Grupa naukowców z Wydziału Inżynierii Komputerowej Uniwersytetu Chung-Ang w Seulu rozwiązała teraz tę lukę, podsumowując aplikacje oparte na wykrywaniu anomalii. Zespół, w skład którego wchodzili profesor Jason J. Jung i dr Gen Li, ocenił aktualne najnowocześniejsze techniki wykrywania anomalii i zajął się wyzwaniami z nimi związanymi. Ich praca została udostępniona online 17 października 2022 r. i zostanie opublikowana w tomie 91 czasopisma Information Fusion w marcu 2023 r . Jak wyjaśnił prof. Jung „Naszym podstawowym tematem badawczym jest wykrywanie anomalii w wielowymiarowych szeregach czasowych. W tym przeglądzie podsumowaliśmy podejścia, wyzwania i zastosowania tego samego.”
Duet badaczy intensywnie pracował nad wykrywaniem anomalii szeregów czasowych dla wielu zmiennych i wcześniej publikował swoje prace dotyczące wykrywania napadów, monitorowania klimatu i monitorowania oszustw finansowych, których kulminacją była niniejsza recenzja. Zespół najpierw sklasyfikował anomalie na trzy typy, a mianowicie nieprawidłowe punkty czasowe, przedziały czasowe i szeregi czasowe. Następnie podkreślili, że spośród sztucznych sieci neuronowych opartych na deep learning, do wykrywania nieprawidłowych punktów czasowych i przedziałów czasowych najczęściej stosuje się pamięć długoterminową (LSTM) i autoenkodery. Ponadto, omówili alternatywne metody, takie jak wykresy dynamiczne, które badają cechy relacyjne między szeregami czasowymi i wykrywają nieprawidłowe interwały czasowe. Dostarczono również szczegółowe podsumowanie aktualnych ograniczeń rozpowszechnionych technik, podkreślając pierwotną przyczynę anomalii.
Na koniec duet przedstawił dokładny przegląd zastosowań wykrywania anomalii w wielowymiarowych szeregach czasowych. Zorganizowali zestawy danych szeregów czasowych w otwartym dostępie, a także omówili otwarte pytania badawcze i wyzwania związane z wykrywaniem anomalii w wielowymiarowych szeregach czasowych.
Potencjał podejść opartych na głębokim uczeniu się do wykrywania anomalii jest dalekosiężny, jak przypuszcza prof. Jung: „ Wierzę, że ten przegląd pomoże naukowcom znaleźć odpowiednie podejście do wykrywania anomalii w odpowiednich obszarach ich pracy. Na przykład w dziedzinie nauki, ludzie mogą łatwo znaleźć zbiory danych w otwartym dostępie i odpowiadające im najnowocześniejsze metody wykrywania anomalii. W przypadku zastosowań przemysłowych, odpowiednie techniki wykrywania anomalii w celu identyfikacji uszkodzeń i usterek można wygodnie znaleźć w tym przeglądzie. „
Jeśli chodzi o związane z tym wyzwania, opracowanie modelu wyjaśniającego wykryte anomalie ma znaczną wartość, ponieważ może pomóc nam zrozumieć, dlaczego w ogóle wystąpiła anomalia. Wyzwaniem jest zidentyfikowanie związku między nieprawidłowym punktem czasowym a punktem czasowym prowadzącym do tej anomalii.
Przegląd ten jest świetnym źródłem informacji przy wyborze odpowiednich technik wykrywania anomalii dla różnych dziedzin, a także przy opracowywaniu bardziej wydajnych technik wykrywania anomalii.