Anonim

Kas yra vaizdo atpažinimo API ir ką jie gali padaryti už jus? Šiame straipsnyje bus išsiaiškinta, kas yra vaizdo atpažinimas, ką daro API ir kaip tai gali padėti jums ar jūsų verslui geriau išnaudoti internetą. Vaizdų atpažinimas turi didžiulį potencialą įmonėms ir atskiriems silpnaregiams interneto vartotojams.

Kas yra vaizdo atpažinimo API?

Vaizdo atpažinimas yra tas atvejis, kai programinė įranga nustato vaizdo savybes ir tiksliai suskirsto jas į kategorijas. Pvz., Jei įkeliate „Ferrari 458“ vaizdą į vaizdo atpažinimo API, jis turėtų atpažinti, kad tai yra automobilis ir kad jis (arba turėtų būti) raudonas. Priklausomai nuo API, gali būti įmanoma toliau klasifikuoti, atsižvelgiant į naudojamo vaizdo tipą.

Tai gali atrodyti išties nesudėtinga - dažniausiai žmonės gali pažvelgti į nuotrauką ir pasakyti, kas tai yra, nebandydami, bet dažniausiai tai buvo sunki problema išmokyti kompiuterius išspręsti. Daug darbo teko išsiaiškinti, kaip kompiuteris gali suprasti, kaip atrodo viskas, ir mes padarėme didelius žingsnius nuo galimybės atlikti atvirkštinio vaizdo paieškas iki garsiojo „Google“ tinklo „Deep Dream“.

API yra taikymo programos sąsaja. Iš esmės tai yra tarpininkas tarp programos eigų, kuris vienam elementui nurodo, kaip dirbti su kitu, arba pateikia įrankius, reikalingus funkcijai atlikti. Yra dešimtys API tipų, kuriais galima pasiekti įvairius tikslus, naudojant įvairias programavimo kalbas. Šiame kontekste vaizdo atpažinimo API yra įrankis, kurį galite naudoti norėdami pasiekti gilų kai kurių komercinių vaizdo atpažinimo sistemų mokymosi pajėgumą.

Vaizdo atpažinimui reikia daug skaičiavimo galios. Jums reikia daugybės duomenų ir galios visa tai interpretuoti. Dauguma vartotojų paprasčiausiai neturi didelių išteklių, kad sukurtų savo giluminio mokymosi mašiną. Dideli vardai, tokie kaip „Google“ vizijos API, „Microsoft“ veido API, „ImageNet“ ir kiti, turi tokius aparatus ir suteikia prieigą prie jų per API arba nemokamai, arba už tam tikrą mokestį. Tai leidžia įvairaus dydžio įmonėms naudotis šia galia, o vartotojai gali įgyti naujos patirties.

Kaip vaizdo atpažinimas pakeis mūsų interneto patirtį?

Skirtingi interneto vartotojai naudos įvairius vaizdo atpažinimo pranašumus. Pažvelkime į hipotetinį svetainės savininką ir hipotetinį vartotoją, norėdami sužinoti, kokia nauda gali būti abiem pusėms.

Verslo įvaizdžio atpažinimo nauda

Tarkime, kad jūs naudojate savipirkimo portalą, panašų į „Etsy“, arba pažinčių svetainę. Norite valdyti visų vartotojų įkeltų vaizdų kokybę ir tinkamumą. Norite užblokuoti visus suaugusiesiems skirtus ar netinkamus vaizdus ir suskirstyti juos į atitinkamas kategorijas, tačiau visa tai padaryti negalima ranka.

Įveskite vaizdo atpažinimo API. Galite nuskaityti kiekvieną vaizdą ir apibrėžti jį pagal nustatytus kriterijus, naudodami API kartu su tinkamu vaizdo atpažinimo aparatu. Taigi galėtumėte nuskaityti vaizdų biblioteką, norėdami pamatyti nepadorius vaizdus, ​​ir juos ištrinti. Galite nuskaityti vaizdus, ​​kuriuose yra maisto, į kategoriją „maistas“, o megztus - į „vilnonius“. Kai nurodysite API, ką daryti, procesas automatizuotas.

Čia taip pat yra galimybių išplėsti realybę ir interaktyvų vaizdą bei vaizdo įrašą. Vaizdo atpažinimą galite naudoti, jei norite, kad programa atpažintų objektus realiame pasaulyje. Pvz., Galėtumėte nufotografuoti sportbačių porą, kurią kažkas nešioja gatvėje. Jei programa atpažįsta sportbačius, paveikslėlį galima papildyti nuoroda, kad galėtumėte juos nusipirkti sau. Tai naudinga verslui (ji suteikia galimybę nedelsiant parduoti) ir vartotojui (gauna tai, ko nori dabar).

Vaizdo atpažinimo nauda vartotojui

Aukščiau pateiktas sportbačių pavyzdys yra tik vienas akivaizdus būdas vartotojams gauti naudos iš vaizdo atpažinimo. Papildyta realybė reiškia, kad tiesiog fotografuodami produktą galėtume iškart pasiekti apžvalgas, informaciją apie kainą ir daugybę duomenų. Tai suteikia vartotojams didžiulį kiekį duomenų, kad padėtų jiems nuspręsti pirkti.

Šių metų pradžioje AI kalbėjęs Markas Zuckerbergas apibendrino dažnai nepastebimą įvaizdžio atpažinimo naudą. Jis įsivaizdavo vaizdo atpažinimo API, veikiančią su neregiais ar silpnaregiais, kurie galėtų „perskaityti“ vaizdą ir garsiai apibūdinti tai, ką mato. Tai gali turėti didžiulį poveikį neįgaliems interneto vartotojams arba, padidėjus realybei, realiame pasaulyje tam tikrą laiką atsilikti.

Vaizdo atpažinimas taip pat turi reikšmės transporto priemonės saugai. Įdiegtos naujos autonominės stabdymo ir susidūrimo išvengimo technologijos veikia panašiai kaip API, apie kurias kalbėjome. Jie nuskaito ir įvertina vaizdus daug kartų per sekundę, kad kelyje būtumėte saugūs jūs ir jūsų automobilis. Ši technologija taip pat nurodo autonominiams automobiliams, kas yra aplink juos.

Vaizdų atpažinimo API savaime netaps revoliucijos mūsų interneto veikloje. Jie veikia kartu su esamomis technologijomis ir prideda sąveikos ir panardinimo į mūsų matomą pasaulį sluoksnį. Nors šio straipsnio pavyzdžių yra nedaug, žaidimų, filmų, automobilių pramonės, mažmeninės prekybos, pramogų ir bet kurios technologijos, kuriai naudojamos technologijos, potencialas yra didžiulis. Tai tik pradžia to, ką gali pasiekti intelektualiosios sistemos!

Kas yra vaizdo atpažinimo apis ir ką jie gali padaryti už jus?