Šta je prepoznavanje govora?

Upotreba vašeg glasa kao metoda unosa

Prepoznavanje govora je tehnologija koja omogućava govorni unos u sisteme. Razgovarate sa svojim računarom, telefonom ili uređajem i on koristi ono što ste rekli kao ulaz za pokretanje neke akcije. Tehnologija se koristi da zameni druge metode unosa kao što su kucanje, klik ili odabir na druge načine. To je način da napravite uređaje i softver korisnijim i da povećate produktivnost.

Postoji dosta aplikacija i područja u kojima se koristi prepoznavanje govora, uključujući i vojsku, kao pomoć za oštećene osobe (zamislite osobu sa oštećenim ili bez ruku ili prstiju), na medicinskom polju, u robotici itd. U bliskoj budućnosti, gotovo svi će biti izloženi prepoznavanju govora zbog njegovog širenja među zajedničkim uređajima kao što su računari i mobilni telefoni.

Određeni pametni telefoni zanimljivo koriste prepoznavanje govora. Primjeri toga su iPhone i Android uređaji. Preko njih, možete pokrenuti poziv na kontakt samo tako što ćete dobiti upućene instrukcije kao što su 'Pozivnica'. Moguće je zabavljati i druge komande, poput 'Uključiti Bluetooth'.

Problemi s prepoznavanjem govora

Prepoznavanje govora, u svojoj verziji poznatoj kao Govor u tekst (STT), takođe se dugo koristi za prevođenje izgovaranih riječi u tekst. "Pričaš, to tipovi", kao što bi ViaVoice rekao na svojoj kutiji. Ali postoji jedan problem sa STT-om, kao što znamo. Pre više od 10 godina, probao sam ViaVoice i nije prošao nedelju dana na mom računaru. Zašto? Bilo je jako netačno, i završio sam trošio više vremena i energije govoreći i ispravljajući nego što sve kucam. ViaVoice je jedan od najboljih u industriji, pa zamislite ostalo. Tehnologija je sazrela i poboljšala, ali govor u tekstu još uvek čini ljude postavljanjem pitanja. Jedna od njegovih glavnih poteškoća je ogromna varijacija ljudi u izgovaranju reči.

Nisu svi jezici predviđeni za prepoznavanje govora, a oni koji često ne podržavaju, kao i engleski jezik. Kao rezultat toga, većina uređaja koji pokreću softver za prepoznavanje govora rade razumno samo sa engleskim jezikom.

Zbog skupa hardverskih zahteva u određenim slučajevima je prepoznavanje govora teško raspoređeno. Potreban vam je mikrofon koji je dovoljno inteligentan za filtriranje pozadinskog šuma, ali u isto vrijeme dovoljno snažan da prirodno prima zvuk.

Govoreći o šumu u pozadini, može prouzrokovati neuspjeh čitavog sistema. Kao rezultat toga, prepoznavanje govora u mnogim slučajevima ne uspije zbog glasusa koji su van korisničke kontrole.

Prepoznavanje govora se pokazalo boljim kao metod unosa za nove telefone i komunikacijske tehnologije kao što je VoIP, nego kao alat za produktivnost za unošenje malog teksta.

Primjene prepoznavanja govora

Tehnologija postaje popularna u mnogim oblastima i bila je uspešna u sledećim:

- Kontrola uređaja. Samo kažem "OK Google" na Android telefon pokreće sistem koji je ušiju u vaše glasovne komande.

- Automatski Bluetooth sistemi. Mnogi automobili su opremljeni sistemom koji povezuje svoj radio-mehanizam sa vašim pametnim telefonom putem Bluetooth-a. Tada možete upućivati ​​i primati pozive bez dodirivanja pametnog telefona, a čak možete upućivati ​​brojeve tako što ih samo izgovarate.

- Transakcija glasa. U područjima na kojima ljudi moraju puno otkucati, neki inteligentni softver prikuplja svoje izgovorene riječi i ih prepisuje u tekst. Ovo je trenutno u određenom softveru za obradu teksta. Govorna transkripcija takođe radi sa vizuelnom govornom poštom .