Smart/Intelligent edge – umelá inteligencia v dátovej analytike na hrane siete

V predchádzajúcich častiach série Smart/Intelligent edge [1], [2] sme analyzovali potenciál využitia prostriedkov umelej inteligencie (UI) v sieťach s výpočtami na hrane s dôrazom na dynamické sieťové architektúry, inteligentný priestor a robotiku. V tejto časti sa budeme zaoberať algoritmami UI vhodnými pre dátovú analytiku na hrane siete.
Smart/Intelligent edge – umelá inteligencia v dátovej analytike na hrane siete

Prečo použiť umelú inteligenciu na hrane siete?

Väčšina mobilných aplikácií, IoT zariadení a iných aplikácií, ktoré implementujú algoritmy UI, závisí od výpočtovej sily cloudu alebo dátových centier nachádzajúcich sa vo vzdialenosti tisícky kilometrov. Sú aplikácie, kde čas nehrá rolu pri samotných procesoch, a tak je inteligencia aplikácií nahradená inteligenciou, výpočtovou silou a obrovským dátovým priestorom cloudu. V prípade aplikácií implementujúcich časovo kritické operácie a procesy môže mať použitie cloudových technológií vážne negatívne dôsledky, napríklad v prípade nepostačujúceho internetového pripojenia alebo jeho výpadku.

Ak chceme takéto úlohy riešiť efektívne a rýchlo a ak pritom chceme znížiť množstvo dát prenášaných medzi cloudom a zariadeniami, je vhodné zvážiť implementáciu UI na hrane siete [3]. Využitie UI na hrane siete zabezpečí lokálne predspracovanie dát, čo prináša niekoľko výhod [4]:

  • citlivé dáta ostávajú v podnikovej sieti,
  • nie je nutné implementovať rôzne komunikačné protokoly pre rôzne zariadenia,
  • redukcia množstva odosielaných a prijímaných dát,
  • zníženie nákladov na cloudové služby,
  • skrátenie reakčného času..

Vývojári aplikácií nemusia zvažovať, či väčšina informácií odosielaných na cloud neobsahuje informácie o osobnej identifikácii a či ich uloženie neporušuje zákony na ochranu osobných údajov. V takom prípade nebudú musieť prijať náležité opatrenia na zabezpečenie informácií, ktoré ukladajú, spracúvajú a zabraňujú tak ich krádeži, nelegálnemu prístupu k nim, zdieľaniu či zneužitiu (GDPR). Rôzni výrobcovia hardvéru využívajú rôzne komunikačné protokoly. Zjednotenie protokolov na hrane siete zjednoduší transakčné služby na strane cloudu. Časť rozhodovacích alebo riadiacich algoritmov sa presunie z cloudu na hranu siete, čo zrýchli reakciu systémov.

Metódy umelej inteligencie využívané na spracovanie veľkých dát

Na hrane siete možno implementovať algoritmy, ktoré nie sú výpočtovo náročné. Príkladom môžu byť metódy symbolickej umelej inteligencie, ktoré už boli okrajovo spomenuté v [5]. V tejto kapitole si opíšeme už spomenuté, ale aj ďalšie algoritmy UI vhodné na analýzu dát [6].

Bayesova teoréma je v teórii pravdepodobnosti a štatistike označená ako pravdepodobnosť udalosti založenej na predchádzajúcich poznatkoch o podmienkach, ktoré môžu súvisieť s udalosťou. Je to spôsob predpovedania budúcnosti na základe predchádzajúcich udalostí. Ako príklad predpokladajme, že spoločnosť chce vedieť, pri ktorých zákazníkoch hrozí, že ich stratia. Pomocou Bayesovej teorémy sa historické údaje o nespokojných zákazníkoch zbierajú a využívajú na to, aby sa predpovedalo, pri ktorých zákazníkoch je pravdepodobnosť, že v budúcnosti odídu. Túto informáciu môže spoločnosť následne využiť na udržanie týchto zákazníkov. Čím viac historických dát ponúkneme Bayesovmu algoritmu, tým presnejšia bude jeho prediktívna sila.

Detekcia anomálií je tiež známa ako detekcia výnimiek. Pozostáva z identifikácie položiek, udalostí alebo zistení, ktoré nie sú v súlade s očakávanými hodnotami alebo so vzorom v súbore dát. Detekcia anomálií dokáže vyhľadať udalosti, napríklad bankové podvody (aplikácie už spomenutej umelej inteligencie). Tiež môže byť využitá v mnohých ďalších oblastiach, z ktorých spomenieme napríklad detekciu chýb, monitorovanie stavu systému a senzorové siete.

Expertné systémy sa môžu využívať v prípadoch, keď je pre človeka analýza veľkého množstva dát vyčerpávajúca. Pravidlové expertné systémy môžu byť použité na extrakciu, uchovávanie a manipuláciu so znalosťou od ľudí s cieľom interpretácie dát užitočnými spôsobmi. V praxi sú pravidlá odvodené od ľudských skúseností a sú reprezentované súborom pravidiel IF-THEN, ktoré sa odvolávajú na inferenčný mechanizmus riadiaci proces využívania týchto pravidiel. Pravidlové expertné systémy môžu byť využité na vytváranie softvéru, ktorý poskytuje odpovede na otázky v danej doméne namiesto odborníka. Ako príklad môžeme uviesť spoločnosť, ktorá má experta analyzujúceho dáta so špecifickým cieľom. Táto práca je však monotónna a zdĺhavá. Pravidlový expertný systém môže jeho znalosti zachytiť a zautomatizovať alebo aspoň semiautomatizovať, keď v konečnom dôsledku expert ešte dohliada na výsledky odvodené expertným systémom.

Extrapolácia je proces odhadu hodnoty premennej nad rámec pôvodného rozsahu pozorovania založený na jej vzťahu s ostatnými premennými. Ako príklad predpokladajme, že niektoré dáta vykazujú trend a my chceme vedieť, ako sa bude tento trend vyvíjať v priebehu času. Avšak nie všetky trendy sú lineárne. Pri lineárnych trendoch je to jednoduché, no pri nelineárnych trendoch musíme využiť extrapolačné funkcie. Tieto algoritmy sú založené na polynomiálnych, kónických alebo krivkových rovniciach.

Neurónové siete inšpirované biologickými neurónovými sieťami sa najčastejšie používajú ako univerzálny aproximátor funkcií, čím majú veľmi široké uplatnenie. Pred nasadením treba neurónovú sieť natrénovať a otestovať. Trénovanie môže byť výpočtovo veľmi náročná úloha, preto je na tento úkon vhodné využiť cloudové služby. Po úspešnom otestovaní a nasadení už netreba neurónovú sieť trénovať, a preto môže byť algoritmus aplikovaný na zariadenia s nižším výpočtovým výkonom, napríklad aj na hrane siete. Praktické využitie neurónových sietí je veľmi široké. Od úloh, ako je napríklad predikovanie opotrebenia ložísk v prevodovke alebo predikovanie správania zákazníkov pri nakupovaní, až po identifikáciu osôb na obrazoch alebo rozpoznávanie anomálií pri vyhodnocovaní kvality produktov.

Rozpoznávanie vzorov sa využíva na detekciu vzorov a zákonitostí v údajoch a je formou strojového učenia. Systémy rozpoznávania vzorov majú na vstupe trénovacie dáta, trénovanie takéhoto systému sa nazýva kontrolované učenie (učenie s učiteľom). Tiež môžu byť použité na objavovanie predtým neznámych vzorov pomocou nekontrolovaného učenia (učenie bez učiteľa). Na rozdiel od detekcie anomálií, ktorá zobrazuje potenciálne anomálie založené na jednom type údajov, rozpoznávanie vzorov môže objaviť predtým neznáme vzorce v niekoľkých druhoch dát a vziať do úvahy vzorce alebo vzťahy medzi dátami. Spoločnosť akéhokoľvek odvetvia môže mať záujem o to, aby zistila, kedy sa začína opakovať istý vzor. Napríklad keď si zákazník k určitej položke kupuje súčasne inú položku. Druhým príkladom môže byť využitie v profilaktike zistením závislostí opotrebovania rôznych súčastí strojov, ktoré zo sebou priamo nesúvisia.

Rozhodovacie stromy sú nástrojom na klasifikáciu alebo predikciu. Základom klasifikačného algoritmu je rozhodovací strom, v ktorom sa posúva objekt (položka) s určitým počtom atribútov, pričom v priestore stromu sa pohybuje od krajných vetiev až po vrchol stromu podľa uvedených atribútov. Vo vrchole stromu sa klasifikuje do určitej klasifikačnej skupiny. V praxi môže podnik tieto stromy využiť napríklad pri nákupoch, keď si musí vybrať medzi viacerými produktmi s rôznou úrovňou kvality a cenou, alebo pri rozhodovaní, či produkty vôbec kúpiť, ak by hrozilo preplnenie skladov.

Zhlukovanie je algoritmus, ktorý spája dátové body (udalosti, ľudí alebo veci) do špecifických skupín vzhľadom na podobnosť bodov v určitých parametroch. Tieto skupiny (zhluky) môžu byť následne použité na vytvorenie poznatkov. Vzhľadom na súbor dátových bodov môžeme použiť zhlukovacie algoritmy na klasifikáciu každého dátového bodu do konkrétnej skupiny. Teoreticky by dátové body, ktoré sú v rovnakej skupine, mali mať podobné vlastnosti, zatiaľ čo dátové body v rôznych skupinách by mali mať odlišné kľúčové vlastnosti. Zhlukovanie je metóda nekontrolovaného učenia a je bežnou technikou pri štatistickej analýze dát používanej v mnohých oblastiach. V praxi by bol takýto algoritmus vhodný napríklad na zatriedenie nákupných vzorov jednotlivých zákazníkov. Následne by bolo odporúčanie produktov pre zákazníka založené na skúsenostiach zákazníkov, ktorí si zakúpili podobné produkty alebo ktorí patria do rovnakej skupiny (napr. podľa veku, pohlavia, bydliska alebo finančného zabezpečenia).

Budúcnosť UI na hrane siete

Smart/Intelligent edge umožní zjednodušiť proces triedenia a identifikácie komplexných údajov, kľúčových pohľadov a akčných plánov. Táto technológia môže firmám pomôcť získať konkurenčnú výhodu prostredníctvom lepšieho rozhodovania, lepšej návratnosti investícií, efektívnosti prevádzky a úspory nákladov.

Existujú však aj nevýhody nasadenia UI na hrane siete. Náklady na nasadenie a správu môžu byť spočiatku vyššie, ale vzhľadom na zefektívnenie procesov možno očakávať ich zníženie, čím bude z dlhodobého hľadiska prvotná investícia rentabilná. Trénovanie niektorých algoritmov UI je však pomerne výpočtovo náročné, preto treba tieto operácie distribuovať medzi edge a cloud a tiež medzi edge zariadenia navzájom. Výpočtovo náročné trénovanie by mohlo prebiehať na výkonných cloudových serveroch a natrénované modely by boli distribuované na edge zariadenia. Tejto tematike sa budeme venovať v nasledujúcej časti seriálu.
Stále sa zvyšujúci výpočtový výkon zariadení dovoľuje využívať čoraz zložitejšie algoritmy na samotných zariadeniach a tiež na hrane siete, čím otvárame cestu náročným algoritmom UI.

Poďakovanie

Publikácia bola podporená projektom VEGA 1/0663/17 Inteligentné kyber-fyzikálne systémy v heterogénnom prostredí s podporou IoE a cloudových služieb.

Referencie

[1] Vaščák, J. – Čupková, D. – Zolotová, I.: Smart/Intelligent edge – umelá inteligencia v dynamických sieťových architektúrach. In: ATP Journal, 2019, roč. 26, č. 1, s. 38 – 39. ISSN 1335-2237.
[2] Vaščák, J. – Čupková, D. – Zolotová, I.: Smart/Intelligent edge – umelá inteligencia v inteligentnom priestore a všadeprítomnej robotike. In: ATP Journal, 2019, roč. 26, č. 2, s. 42 – 43. ISSN 1335-2237.
[3] Li, H. – Ota, K. – Dong, M.: Learning IoT in edge: deep learning for the internet of things with edge computing. In: IEEE Network, 2018, 32(1), pp. 96 – 101.
[4] Papcun, P. – Kajáti, E. – Čupková, D. – Mocnej, J. – Miškuf M. – Zolotová I. (2019). Edge-enabled IoT gateway criteria selection and evaluation. In: Concurrency and Computation Practice and Experience. [online]. Dostupné na: https://doi.org/10.1002/cpe.5219.
[5] Kajáti, E. – Miškuf, M. – Mocnej, J. – Zolotová, I.: Smart/Intelligent edge – informačný model a analýza dát. In. ATP Journal, 2018, roč. 25, č. 8, s. 36 – 37. ISSN 1335-2237.
[6] Gamboa, J. C. B.: Deep learning for time-series analysis. In: Cornell University arXiv: 1701.01887, 2017.

Ing. Dominika Čupková
Ing. Erik Kajáti
doc. Dr. Ján Vaščák
Ing. Peter Papcun, PhD.

Technická univerzita v Košiciach FEI
Katedra kybernetiky a umelej inteligencie
Centrum inteligentných kybernetických systémov
http://ics.fei.tuke.sk