Čo bude nasledovať v obrazovom a hlasovom vyhľadávaní?
Asi pred 10 rokmi by bolo ťažké uveriť, že by ste sa mohli spýtať reproduktor na Bluetooth ohľadom klasického receptu na suflé. A čo tak urobiť snímku s použitím telefónu a presne zistiť, kde danú vec kúpiť. Napriek tomu sme tu.
Tieto interakcie boli primárne realizované prostredníctvom pokroku v strojovom vzdelávaní AI. Jeden z najväčších vývojov v oblasti AI za posledné tri roky bol v oblasti rozpoznávania hlasu a spracovania prirodzeného jazyka. Už začíname vidieť pokrok v zložitejšej interakcii ľudských strojov vo forme vyhľadávania obrázkov / videí.
Myslenie dopredu niektorých podnikov už využíva túto novú formu strojového učenia AI. Rozpoznávanie obrázkov, ktoré umožňuje užívateľom vyhľadávať produkty pomocou obrázkov na hľadanie rovnakých alebo podobných vzhľadov napríklad oblečenia, ktorým zásobujú svoje obchody. Avšak znamená to, že inteligentné vyhľadávanie obrázkov je ďalšou veľkou vecou?
Skoré dni vyhľadávania obrázkov v AI
Veľké vyhľadávacie nástroje už pred nejakou dobou podporili formu vyhľadávania obrázkov. Spoločnosť Google uviedla „obrázky Google“ už v roku 2001 kvôli dopytu po fotografiách Jennifer Lopez v zelených šatách Versace, ktoré by bežné vyhľadávanie Google nemohlo zvládnuť. Funkcie sa nakoniec vyvinuli tak, aby boli schopné presúvať obrázky a nájsť rovnaké alebo iné podobné obrázky.
Pokrok v „vyhľadávaní obrázkov“ umožňuje extrémne vysoký stupeň presnej klasifikácie obrazu rozpoznaním prvkov a objektov založených na špecifických atribútoch identifikovaných v danom obrázku.
Budúcnosť vyhľadávania obrázkov
Spoločnosť Google (rovnako ako ostatné) nedávno začala integrovať funkcie, ktoré umožňujú používateľom nakupovať produkty zachytené pomocou smartfónu, ako je napríklad ASOS. Zatiaľ čo vyhľadávanie obrázkov bude mať svoje praktické využitie, súčasné nasadené implementácie v inteligentných zariadeniach pravdepodobne budú mať teraz len veľmi obmedzený vplyv na správanie vo všeobecnom vyhľadávaní.
Zatiaľ čo základné aplikácie vyhľadávania obrázkov môžu byť použité na identifikáciu dostupných produktov, technológia sa bude naďalej vyvíjať, stáva sa rýchlejšou a presnejšou, čo vedie k sofistikovanejším, rôznorodejším aplikáciám a prípadom použitia.
Vidíme prípady použitia, ktoré boli v minulosti viditeľné len v sci-fi, ako napríklad rozpoznávanie tvárí v reálnom čase v aplikáciách AR. Ďalším príkladom je aplikácia v medicíne. Stroj dokáže automaticky identifikovať skoré príznaky zdravotných stavov z röntgenového alebo MRI skenovania bez nutnosti odborného lekára na interpretáciu výsledkov.
Hlavnou výzvou pre túto technológiu je to, že tieto účelové modely na rozpoznávanie obrazov sú rovnako dobré ako ich výcvikové dáta, čo znamená, že každá aplikácia môže byť značne narušená, ak nie je vykonaná správne alebo ak nie je vykonaná bez dostatočne správne označených údajov.
Vyhľadávanie obrázkov proti hlasovému vyhľadávaniu
Napriek pokroku vo vyhľadávaní obrázkov a jeho súčasnej implementácii bude hlas pravdepodobne preferovaným spôsobom, ako v budúcnosti požadovať informácie. Je pravdepodobné, že vyhľadávanie na základe obrázkov doplní hlas, čo umožní bohatší spôsob interakcie s asistentmi AI.
Amazon Echo Look sa zameriava na aktívnu integráciu hlasového aj obrazového vyhľadávania, aby vytvoril jedinečnú hodnotu. Umožňuje virtuálnemu asistentovi skenovať a navrhnúť oblečenie pre svojho používateľa. Algoritmus kombinovaný so vstupom od módnych odborníkov je potom schopný urobiť odporúčania týkajúce sa štýlu. Ďalej napríklad môže poskytnúť rôzne „rady“ prostredníctvom aplikácie na vašom smartphone. Ide o skvelé príklady toho, ako môže hlasové vyhľadávanie a vyhľadávanie obrázkov pomôcť zlepšiť interakciu medzi používateľmi a virtuálnymi asistentmi.
Kto teda zvíťazí?
Porovnanie hlasového vyhľadávania s vyhľadávaním obrázkov je ako porovnanie klávesnice s myšou. Obe majú svoje miesto vo svete, kde vyhľadávanie a objavovanie bude prevažne podporované interakciami s virtuálnymi asistentmi.