Što je prepoznavanje govora?

Upotreba glasa kao metode unosa

Prepoznavanje govora je tehnologija koja omogućuje govorni ulaz u sustave. Razgovarate s računalom, telefonom ili uređajem i upotrebljavate ono što ste rekli kao unos da biste pokrenuli neku radnju. Tehnologija se koristi za zamjenu drugih metoda unosa, poput tipkanja, klikanja ili odabira na druge načine. To je sredstvo za stvaranje uređaja i softvera jednostavnijim za korištenje i povećanju produktivnosti.

Mnogo je primjena i područja u kojima se prepoznavanje govora koristi, uključujući i vojsku, kao pomoć osobama s invaliditetom (zamislite osobu s paraliziranim ili bez ruku ili prstiju), medicinskom polju, robotici itd. U bliskoj budućnosti, gotovo svatko će biti izložen prepoznavanju govora zbog širenja među uobičajenim uređajima poput računala i mobilnih telefona.

Neki pametni telefoni koriste zanimljivu upotrebu prepoznavanja govora. Primjeri toga su iPhone i Android uređaji. Kroz njih možete uputiti poziv kontaktu samo uzimajući izgovorene upute poput "Pozivnica". Također se mogu zabavljati i druge naredbe, poput "Uključi Bluetooth".

Problemi s prepoznavanjem govora

Prepoznavanje govora, u svojoj verziji poznatoj kao Govor na tekst (STT), također se dugo koristi za prevođenje izgovorenih riječi u tekst. "Razgovarate, to tipovi", kako bi ViaVoice rekao na svojoj kutiji. Ali postoji jedan problem s STT-om kao što znamo. Više od 10 godina nazad, pokušao sam ViaVoice i nije prošao tjedan dana na mojem računalu. Zašto? Bilo je grubo netočno, a ja sam završio trošiti više vremena i energije govoreći i ispravljati nego tipkati sve. ViaVoice je jedan od najboljih u industriji, pa zamislite ostatak. Tehnologija je sazrela i poboljšala, ali govor u tekstu i dalje postavlja pitanja. Jedna od glavnih poteškoća je velika razlika među ljudima u izgovoru riječi.

Nije prepoznavanje svih jezika u prepoznavanju govora, a oni koji to često ne podržavaju, kao i engleski. Kao rezultat toga, većina uređaja koji rade softver za prepoznavanje govora razumno funkcionira samo s engleskim.

Skup hardverskih zahtjeva čini prepoznavanje govora teško implementirati u određenim slučajevima. Potreban vam je mikrofon koji je dovoljno inteligentan da filtrira pozadinsku buku, ali istodobno dovoljno snažnu za snimanje glasa prirodno.

Govoreći o pozadinskoj buri, može uzrokovati da cijeli sustav propadne. Kao rezultat toga, prepoznavanje govora u mnogim je slučajevima neuspješno zbog buke koje nisu korisničke kontrole.

Prepoznavanje govora pokazalo se bolje kao način unosa za nove telefone i komunikacijske tehnologije kao što je VoIP, nego kao alat za produktivnost za masovni unos teksta.

Primjena prepoznavanja govora

Tehnologija dobiva popularnost u mnogim područjima i uspješna je u sljedećem:

- Kontrola uređaja. Samo govoreći "OK Google" na telefonu s Androidom pokrećete sustav koji je sve uši vašim glasovnim naredbama.

- Auto Bluetooth sustavi. Mnogi automobili opremljeni su sustavom koji povezuje radio mehanizam s vašim smartphoneom putem Bluetootha. Zatim možete upućivati ​​i primati pozive bez dodirivanja pametnog telefona, a čak ih možete nazvati i samo ih izgovarati.

- Transkripcija glasa. U područjima gdje ljudi moraju puno upisivati, neki inteligentni softver bilježi svoje izgovorene riječi i transkribira ih u tekst. Ovo je trenutno u određenom softveru za obradu teksta. Glas transkripcija također radi s vizualnom govornom poštom .