Umelá inteligencia rozširuje možnosti IoT, Prehľadové články, Rubriky,

Internet vecí (IoT) pretvára domácnosti a robí z nich príjemnejšie, úspornejšie a bezpečnejšie miesto. Či už ide o ovládanie klimatizácie a kúrenia, nastavenie kuchynských spotrebičov alebo domácich bezpečnostných systémov, konektivita zariadení s podporou internetu vecí znamená, že ľudia môžu ovládať svoje domovy odkiaľkoľvek.

Pridanie umelej inteligencie do internetu vecí prináša úplne nový rad pokročilých funkcií. Rozpoznanie tváre umožňuje domácemu alarmu zistiť, kto je pri dverách, čo zabezpečí, aby ich otvorili iba ľudia, ktorí sú „rozpoznaní“. Rozpoznávanie hlasu možno zabezpečiť dokonca aj v rámci mobilných zariadení, vďaka čomu dokáže majiteľ domu ovládať svetlá, televízory a varné kanvice iba prostredníctvom hovoreného slova

Pozri, kto to hovorí

Technológia rozpoznávania tváre (FRT) je najväčším pokrokom v bezpečnostných systémoch od zavedenia CCTV kamier a zvyčajne sa používa na autentifikáciu používateľov prostredníctvom služieb overovania ID. Je schopná porovnať ľudskú tvár z digitálneho obrázka alebo videozáznamu s databázou tvárí a funguje tak, že presne určí a zmeria rysy tváre z daného obrázka. FRT je veľmi úspešná v pomerne malých populáciách v kontrolovanom prostredí.

Kvalita snímaného obrazu je rozhodujúcim faktorom výkonu systémov FRT. Medzi ďalšie faktory patrí prostredie – FRT vo všeobecnosti funguje lepšie, keď možno porovnať podobné aspekty okolitého prostredia, ako je pozadie, veľkosť a orientácia hlavy, vzdialenosť kamery a svetelné podmienky. Vek obrázka je tiež dôležitý, pretože algoritmus funguje lepšie, ak medzi porovnávanými obrázkami uplynulo menej času. Maximálny výkon možno dosiahnuť vtedy, ak má kamera, ktorá zachytila obraz, podobné optické vlastnosti ako kamera, ktorá získala obraz na mieste.

Rozpoznávanie reči označuje súbor technológií, ktoré umožňujú počítačom rozpoznávať hovorené slová. Je tiež známy ako automatické rozpoznávanie reči (ASR), počítačové rozpoznávanie reči alebo prevod reči na text (STT). Niektoré systémy rozpoznávania reči vyžadujú trénovanie, pri ktorom osoba číta text alebo izolovanú slovnú zásobu do systému. Systém analyzuje hlas osoby a používa ho na zlepšenie presnosti rozpoznávania reči danej osoby. Tieto systémy sa nazývajú systémy závislé od rečníka, zatiaľ čo systémy, ktoré nepoužívajú trénovanie, sa nazývajú nezávislé od rečníka.

Aplikácie využívajúce rozpoznávanie reči zahŕňajú hlasové používateľské rozhrania, ako je hlasové vytáčanie, smerovanie hovorov, napríklad „Chcem uskutočniť hovor“ a ovládanie domácich spotrebičov. Známym príkladom rozpoznávania reči v každodennom živote je riešenie Amazon Alexa. Keď sa ho spýtate na počasie alebo futbalové skóre, riešenie zaznamená vaše slová a odošle ich na servery Amazonu, ktoré majú výpočtový výkon na ich efektívnejšiu analýzu. Vaše slová sú rozdelené na jednotlivé zvuky, ktoré sa potom porovnávajú s databázou, aby sa rozhodlo, ktoré slová sa najviac zhodujú s touto kombináciou zvukov. Len čo má predstavu o slovách, systém vyberie tie najdôležitejšie, aby dávali zmysel úlohe. Ak napríklad rozpozná slová ako „dážď“ alebo „teplota“, otvorí aplikáciu počasia. Servery posielajú informácie späť Alexe, ktorá potom povie, čo potrebujete vedieť.

Do cloudu alebo lokálne?

Systém UI, ktorá bude spracovávať údaje rozpoznávania tváre alebo hlasu, možno umiestniť na dvoch miestach – v cloude alebo na samotnom zariadení internetu vecí. Pri lokálnom spracovaní poskytuje výpočtový výkon zariadení jednu veľkú zjavnú výhodu – skracuje oneskorenie, t. j. čas potrebný na prenos údajov zo zdroja do cieľa, čím sa zvyšuje rýchlosť. V dôsledku tohto lokálneho spracovania nie je potrebné žiadne prepojenie, avšak v závislosti od aplikácie môže byť na zariadení IoT potrebný oveľa väčší výpočtový výkon. Takýto systém môže byť tiež náročný na aktualizáciu na diaľku, pričom aktualizácie môžu byť obmedzené výkonom hardvéru. Čoraz dôležitejším aspektom je bezpečnosť. Distribuované spracovanie údajov znamená, že na centrálny server sa prenáša menej, čím sa znižuje riziko. Ak už aj dôjde k napadnutiu zariadenia, je tiež jednoduchšia jeho „izolácia“.

Pri cloudových riešeniach je konektivita zariadenia nevyhnutnosťou. Táto metóda znižuje požiadavky na výkon lokálneho spracovania a v prípade väčšieho počtu zariadení sú aktualizácia alebo vývoj algoritmov jednoduchšie. Nevýhodou je, že to môže vyžadovať dodatočné náklady na služby a môže sa vyskytnúť riziko spojené s odosielaním potenciálne citlivých údajov mimo podniku.

Spolu s hardvérom pre internet vecí je jednou z možností využitie lokálne založeného systému spracovania, niekedy známeho ako Edge. V tomto prípade viaceré uzly IoT odosielajú údaje do zariadenia Edge na spracovanie, čo poskytuje mnohé z výhod spracovania priamo na zariadení, ale znižuje potrebu, aby každý uzol mal schopnosť vysokého výpočtového výkonu.

Umelá inteligencia typu „urob si sám“

Aplikácie na rozpoznávanie tváre a hlasu možno zrealizovať aj pomocou jednodoskového počítača, akým je napríklad Raspberry Pi. Pri rozpoznávaní tváre dokáže Raspberry Pi rozpoznať tváre na obrázku a identifikovať a zmapovať ich kľúčové črty v reálnom čase, vďaka čomu je ideálny pre vnútorné bezpečnostné aplikácie. Spoločnosť Farnell zostavila súpravu komponentov, aby bolo vytváranie aplikácií na rozpoznávanie tvárí jednoduchšie. Súprava pozostáva z Raspberry Pi 4, Raspberry Pi High-Quality Camera a dosky Pimoroni Automation HAT.

Raspberry Pi 4 je séria malých jednodoskových počítačov s 1,5 GHz 64-bitovým štvorjadrovým ARM procesorom Cortex-A72, so zabudovanou Wi-Fi 802.11ac, s Bluetooth 5, plne gigabitovým ethernetom, dvomi portmi USB 2.0, dvomi portmi USB 3.0 a podporou dvoch monitorov prostredníctvom dvojice portov micro Type D HDMI na rozlíšenie až 4K. Pi 4 je napájaný cez USB-C port.

Kamera Raspberry Pi pozostáva z 12,3 megapixelového snímača Sony IMX477, ktorý je založený na architektúre snímača so zadným osvetlením, s nastaviteľným zadným zaostrením a podporou objektívov s bajonetom C a CS

Pimoroni Automation HAT s relé, analógovými kanálmi, napájanými výstupmi a vyrovnávacími vstupmi (všetky s napájaním 24 V) teraz môžete k svojmu Raspberry Pi pripojiť s množstvom vychytávok naraz. Ideálne pre projekty inteligentnej domácnosti a automatizácie, ktoré poskytujú vašej zelenej domácnosti inteligentné postrekovače alebo plánujú kŕmenie rýb.

Detegované obrázky musia byť pred rozpoznaním spracované, príkladom čoho je konverzia obrázka na sivú. Jedným z populárnych balíkov na spracovanie obrázkov je OpenCV (Open Source Computer Vision Library), ktorý je navrhnutý tak, aby urýchlil využitie strojového vnímania v komerčných produktoch a ponúkol spoločnú aplikačnú infraštruktúru počítačového videnia.

OpenCV sa používa hlavne pri činnostiach súvisiacich so spracovaním obrázkov a pomáha pri funkciách, ako je detekcia tvárí a ich vlastností, zisťovanie tvarov, ako sú kruhy a obdĺžniky na obrázku, a rozpoznávanie textu na obrázkoch, ako sú poznávacie značky. OpenCV sa ľahko učí, funguje takmer so všetkými hlavnými jazykmi a možno ho používať bezplatne.

Ďalšia súprava, ktorú ponúka spoločnosť Farnell, predstavuje rýchlu cestu k vybudovaniu automatizovanej domácnosti založenej na rozpoznávaní hlasu na ovládanie domácich spotrebičov, ako sú svetlá, ventilátory a televízory. Riešenie využíva buď mobil s podporou Alexa, alebo Amazon Echo Dot a dosku Raspberry Pi 4 Board. Zariadenie s podporou Alexa prijíma hlasové príkazy a používa ich na zapnutie alebo vypnutie akéhokoľvek domáceho spotrebiča prostredníctvom relé pripojeného k doske Raspberry Pi. Táto virtuálna súprava obsahuje Raspberry Pi 4 a dosku Pi-Relay.

Doska Pi-Relay je preferovaným riešením na ovládanie zariadení s vysokým výkonom, ako sú motory a svetlá. Dodáva sa so štyrmi vysokokvalitnými relé a záťažou až 7 A/240 VAC, ktoré dokážu pracovať s typickými domácimi spotrebičmi, ako sú žiarovky, rôzne LED svetlá a ventilátory. LED diódy na doske indikujú stav každého relé, zatiaľ čo na prístup k RPi GPIO sa používa 40-pinová hlavička. Cez relé môže byť pripojená akákoľvek záťaž, ako napríklad svetlo, ovládaná pomocou Raspberry Pi 4.

Vzájomná súhra

Vďaka poskytnutiu vysokého výpočtového výkonu a pokročilých algoritmov pre IoT umožňuje UI používateľom v domácnostiach realizovať pokročilé riadiace a bezpečnostné aplikácie, vďaka čomu je ich život jednoduchší a bezpečnejší. Použitie ľahko implementovateľných algoritmov UI na lacnom jednodoskovom počítači, akým je Raspberry Pi, je ideálnym spôsobom, ako plnohodnotne využiť túto technológiu a optimalizovať vaše aplikácie.

Ankur Tomar
technický marketingový manažér
Farnell
www.farnell.com