Proces spracovania a analýza dát na hrane siete

Dáta z IoT a iných zariadení či zdrojov sa zbierajú s cieľom vytvorenia abstrakcie (kybernetický model, digitálne dvojča…) reálneho (Human Cyber Physical – HCP) sveta. Z týchto prichádzajúcich dát sa neskôr tvorí informačný model kvôli získavaniu informácií či neskôr inteligentných vedomostí (znalostí) z nich. Dáta môžeme rozdeliť na dve hlavné skupiny, statické a dynamické [8]. Statické dáta môžu byť predstavované názvami a parametrami zariadení alebo menami obsluhujúcich operátorov. Tie sa menia minimálne. Dynamické dáta sú už konkrétne merania z týchto zariadení. Okrem toho dáta môžu prichádzať v rôznych formátoch na základe typu senzorov a zariadení.

Procesnými krokmi a úpravami by sme mali získať informačný model, ktorý by mal vedieť odpovedať na dôležité otázky modelu 5W – Which, What, When, Where, Why [1]. Ide o informačný postup s použitím klasickej symbolickej umelej inteligencie či ľudskej skúsenosti. Tento proces spracovania dát v IoT systémoch alebo v komplexnejších HCPS (Human Cyber Physical Systems) riešeniach je zobrazený na obr. 1.

V nasledujúcich krokoch si uvedieme činnosti (funkcionality), ktorými možno predspracovať dáta. To znamená najmä znížiť objem prenášaných dát a zvýšiť ich informačnú hodnotu pred uložením a neskoršími analýzami. Často sa práve s novými trendmi spomína umelá inteligencia a používajú sa pojmy, ako napr. intelligent edge. Inteligencia sa vníma ako schopnosť systému prispôsobiť sa novým podmienkam. Veľká časť tejto funkcionality však zvykne byť riešená deterministicky pre presne stanovený rozsah pracovných podmienok vo forme vzorcov alebo iných algoritmov. Preto z nášho pohľadu nejde o umelú inteligenciu v pravom zmysle slova, skôr tomu vyhovuje pojem smart edge. Priestor na aplikovanie takýchto algoritmov sa zvyčajne nachádza na konci tohto procesu v samotnej analýze získaných a prečistených dát. Funkcionalitu uvedenú na obr. 1 sme kategorizovali na základe analýzy vedeckých článkov a našich skúsenosti. Väčšina tejto funkcionality môže prebiehať práve na koncových – edge zariadeniach [5], [6], [7].

  • Data Cleansing & Preprocessing – tento krok má za úlohu zaistiť, aby dáta získané z rôznych zdrojov dávali zmysel. Môže ísť o odstraňovanie neúplných dát. Toto predspracovanie môže ľahko prebiehať už na koncových zariadeniach [4].
  • Data Formatting – hlavou úlohou tejto činnosti je zaistiť, aby prečistené dáta, ktoré prišli v rôznych formátoch, boli preložené do unifikovaného formátu, s ktorým sa ďalej pracuje v IoT platforme. IoT zariadenia väčšinou používajú protokoly MQTT, AMQP alebo OPC UA [3].
  • Data Filtering – nie všetky dáta majú rovnakú informačnú hodnotu. Okrem toho počas meraní sa v systéme vyskytuje šum. V tomto kroku ide o aplikovanie algoritmov, ktoré ďalej odošlú len tie dôležité dáta zbavené šumu [2]. To so sebou prináša množstvo výhod od menšieho zaťaženia sietí, menej uložených údajov až po rýchlejšie trénovanie a zvýšenie presnosti predikčných modelov.
  • Data Fusion – zjednotením dát, podobne ako pri filtrácii, možno znížiť objem prenášaných dát. Existujú tri základné kategórie zjednotenia dát:
    – Complementary – jeden z najjednoduchších spôsobov zjednotenia dát. Táto metóda je použiteľná pri senzoroch, ktoré merajú fyzikálne podobné veličiny. Vopred definovaným výpočtom môžeme z viacerých hodnôt získať jednu veličinu, ktorá nám o danom systéme poskytne rovnakú informáciu ako kombinácia týchto meraní. Môže ísť napríklad o získanie hodnoty, ktorá vznikne rozdielom medzi teplotou prostredia a teplotou stroja.
    – Competitive – pri tomto prípade zjednotenia dát výsledná hodnota vzniká kombináciou alebo porovnaním hodnôt meraní z viacerých senzorov. V našom prípade by mohlo ísť o meranie teploty stroja pomocou termokamery a IoT teplomera.
    – Cooperative – pri tejto metóde definujeme výpočet, v ktorom z viacerých koeficientov dostaneme finálnu hodnotu. Napríklad monitorovaním funkcií môžeme kategorizovať stav stroja do kategórií: všetko v poriadku, zhoršený stav, kritický stav.
  • Data Grouping – v tomto kroku môžu byť dáta roztriedené do kategórií napríklad podľa zdroja: stroje, operátori a podobne. To môže pomôcť pri porovnávaní a analýze týchto dát.

Väčšina funkcionalít z predchádzajúcich bodov sa zvyčajne rieši bez použitia inteligentných metód strojového učenia. K najčastejšiemu použitiu týchto metód dochádza až v samotnej analýze dát.

  • Data (Pre-)Analytics – môže poskytovať algoritmy, ktoré môžu vykonávať klasické symbolické deskriptívne, prediktívne či preskriptívne analytické úlohy. Najčastejšie môže isť o:
    – zhlukovanie (napr. spájanie dát do tried podľa podobnosti),
    – klasifikáciu (napr. klasifikácia závažnosti stavu, detekcia anomálií),
    – regresiu (napr. predikcia vývoja teploty).
  • Data visualisation – ide o vrstvu, v ktorej sa zobrazujú namerané hodnoty a výsledky analýz. Táto vrstva tvorí rozhranie medzi systémom a človekom.

Záver

Každým rokom počty pripojených zariadení do siete a nimi odoslaných dát exponenciálne rastú. Dnešná doba je dobrým štartovacím bodom na implementáciu technológií, ktoré dokážu inteligentne spracúvať dáta čo najbližšie miestu ich vzniku. Veľkú časť tejto funkcionality možno realizovať „šikovnými“ algoritmami (smart, heuristic, human knowledge or skills) alebo klasickými postupmi symbolickej umelej inteligencie bez použitia napr. aktuálne populárnych metód hlbokého strojového učenia (deep machine learning). V tomto článku sme opísali jednu zo základných funkcionalít, a to tvorbu informačného modelu a analýzy dát, ktorá sa môže na tieto účely implementovať v edge-enabled architektúre na hrane siete [5]. V ďalších častiach uvedieme iné naše pohľady na smart/intelligent edge, ako aj skúsenosti z laboratórnych experimentov či reálnych prípadových štúdií, ktoré sme realizovali vo výskumnej skupine Inteligentných kybernetických systémov na Katedre kybernetiky a umelej inteligencie Fakulty elektrotechniky a informatiky Technickej univerzity v Košiciach.

Poďakovanie

V tejto publikácii bola prezentovaná časť výsledkov dizertačnej práce [5]. Publikácia bola podporená projektom VEGA 1/0663/17 Inteligentné kyberfyzikálne systémy v heterogénnom prostredí s podporou IoE a cloudových služieb [70 %] a UVP Technicom Fáza II. ITMS: 313011D232 [30 %].

Literatúra

[1] Zhong, R. Y. – Wang, L. – Xu, X. (2017). An IoT-enabled Real-time Machine Status Monitoring Approach for Cloud Manufacturing. In: Procedia CIRP, 63, pp. 709 – 714.

[2] Mocnej, J. – Miškuf, M. – Papcun, P. – Zolotová, I. (2018). Impact of Edge Computing Paradigm on Energy Consumption in IoT. In: Conference on Programmable Devices and Embedded Systems (PDeS), Ostrava, Česká republika.

[3] Miškuf, M. – Kajáti, E. – Zolotová, I. (2017). Comparison of Cloud IoT Platforms for Smart Metering Solution Based on NodeMCU. In: WSEAS Transactions on Information Science and Applications, vol. 15, p. 50 – 60. ISSN 2224-3402.

[4] Lojka, T. – Miškuf, M. – Zolotová, I. (2016). Industrial IoT Gateway with Machine Learning for Smart Manufacturing. In: IFIP International Conference on Advances in Production Management Systems,, Springer, Cham. pp. 759 – 766.

[5] Miškuf, M. (2018). Edge-enabled framework pre monitorovanie kvality zdravotnej starostlivosti. Dizertačná práca. KKUI FEI TUKE Košice. s. 110.

[6] Mocnej, J. – Lojka, T. – Zolotová, I. (2016). Using information entropy in smart sensors for decentralized data acquisition architecture. In: SAMI 2016, Danvers: IEEE, 2016, pp. 47 – 50. ISBN 978-1-4673-8739-2.

[7] Šimko, B. – Papcun, P. (2016). Simulačné a komunikačné aplikácie pre laboratórny model Mobilný kufor. In: Electrical Engineering and Informatics 7: proceedings of the Faculty of Electrical Engineering and Informatics of the Technical University of Košice, pp. 629 – 634. ISBN 978-80-553-2599-6.

[8] Miškuf, M. – Kajáti, E. – Mocnej, J. – Papcun, P. (2018). Smart/Intelligent edge – princípy spracovania dát na hrane siete. In: ATP Journal, roč. 24, č. 7, s. 50 – 51. ISSN 1335-2237.

  

Ing. Erik Kajáti
Ing. Martin Miškuf, PhD.
Ing. Jozef Mocnej
prof. Ing. Iveta Zolotová, CSc.

Technická univerzita v Košiciach FEI
Katedra kybernetiky a umelej inteligencie
Laboratórium inteligentných kybernetických systémov/Laboratórium IoT
http://ics.fei.tuke.sk