Pretvaranje govora u tekst na pametnim telefonima
Nadajući se da će preskočiti Google i Appleove uspjehe na tržištu pametnih telefona, Microsoft planira koristiti prepoznavanje govora i tehnologiju obrade prirodnog jezika u oblaku kako bi pružila mogućnosti korisničkog sučelja koje nisu pronađene na uređajima iPhone ili Android. "Vjerujemo da govor nije zasebna aplikacija. to je sastavni dio korisničkog doživljaja ", izjavio je Zig Serafin, generalni direktor za unificirane komunikacije tvrtke Microsoft, pred publikom na konferenciji SpeechTEK 2010., koji se održava ovog tjedna u New Yorku.
Kako bi poboljšao mogućnosti Windows Phone 7 za razumijevanje glasovne naredbe i isporuku traženog rezultata, tvrtka planira vezati u telefonima sa sustavom Windows Phone 7 pomoću tvrtke Tellme prepoznavanje glasa i servisa za obradu prirodnog jezika tvrtke Cloud, izjavio je Se rafin, u sljedećem intervjuu s IDG News Serviceom.
[Daljnje čitanje: Najbolji Android telefoni za svaki proračun.]
Microsoft je 2007. godine kupio tvrtku koja je stvorila ovu uslugu, Tellme Networks.Prije publike SpeechTEK, Serafin je iskoristio Android i iPhone operacijske sustave za korištenje ikona kao glavnog oblika interakcije. "Većina pametnih telefona je mreža ikona, poput Windows 3.1", rekao je.
Razgovor s telefonom prirodni je način da joj kažem što da radim, rekao je. "Kad se preselite na uređaj koji nema veliku tipkovnicu, glas je tako snažan dodatak tom iskustvu", rekao je Serafin.
Potom je direktor tvrtke Microsoft Ilya Bukshteyn vodio demonstraciju o tome kako Windows Phone 7 može koristiti prepoznavanje govora i obrada prirodnog jezika ili sredstva pomoću kojih računalo tumači ono što osoba kaže. Bukshteyn je zatražio od telefona da nazove "Paul", a glas koji je emitiran iz mobilne slušalice odgovorio je nizom različitih kontakata s Pavlovim imenom. Bukshteyn je odgovorio specifičnim punim imenom, a telefon je nastavio nazvati tu osobu.
Bukshteyn je također rekao telefonu da otvori album slika, a na zaslonu se pojavila aplikacija za prikaz slika, koja prikazuje ne samo slike koje je snimio korisnik, ali i korisnici prijatelja koji su objavljeni na društvenim mrežama.
U trećem primjeru, Bukshteyn je zatražio popis obližnjih kineskih restorana. Zahtjev je prenesen na uslugu pretraživanja Bing, koji je na mapi vratio popis restorana i njihovih lokacija.
Dok iPhone i Android inačice upotrebljavaju neke mogućnosti prepoznavanja glasa, Microsoftova telefonska usluga bit će drugačija u brojnim poštovanja, rekao je Serafin. Za jedan, to neće biti ograničeno na upotrebu u samo nekoliko aplikacija, nego se može upotrijebiti za upravljanje cijelim telefonom. Drugi način na koji će ova usluga biti jedinstvena jest da će to biti interaktivno. Ako se dobije dvosmislen naredba, mobilna slušalica ili odgovarajuća usluga mogu zatražiti od korisnika da pojasni zahtjev.
Govorna komponenta je dio onoga što Serafin naziva "prirodno korisničko sučelje" ili NUI. NUI se oslanja na glas, dodir i čak pokret kao oblike ulaza.
"Govor je jezgra NUI-a", rekao je. Dio demonstracije pokazao je kako bi tehnologija Kinnect XBox tvrtke Microsoft mogla tumačiti geste ruku za pokretanje radnji na računalu. Ova tehnologija će se koristiti u Microsoftovim proizvodima izvan XBoxa, rekao je Bukshteyn u sljedećem intervjuu s IDG-om. Serafin je rekao da je tvrtka u ranoj fazi interakcije govora u različitim komponentama sustava Windows Phone 7, počevši od onih najtežih
Korisnik može pokrenuti telefon za slušanje glasovnih naredbi tako da držite jednu tipku na telefonu. Neke od jezičnih obrada bit će obavljene na telefonu, a neke će to učiniti Tellme. "Iskreno, korisnik ne bi trebao znati ni brinuti o tome" gdje se obrađuju glasovne naredbe, rekao je Bukshteyn.Serafin je tvrdio da je usluga Tellme najveći korišten sustav za obradu prirodnog jezika temeljenog na govoru koji se danas koristi. Microsoft priprema uslugu velikim organizacijama za podršku telefonskom podrškom za pomoć. Servisna područja preko 2,5 milijardi poziva godišnje za korporativne klijente, rekao je.
Joab Jackson pokriva softverske programe i opće tehnološke vijesti za
IDG News Service
. Slijedite Joab na cvrkut na @Joab_Jackson. Joabova adresa e-pošte je [email protected]
Chambers Unterazed na poremećen govor
Cisco CEO John Chambers pokazao zdravstvene koncepte na Cisco Live govor kratko poremećen od strane radnika prosvjednika. među liječnicima, kao i među senzorima na terenu, može pomoći spriječiti pandemije, rekao je predsjednik i izvršni direktor John Chambers na glavnoj adresi na godišnjoj konferenciji Cisco Live klijenta koja je nakratko bila narušena prosvjedom i tehničkim problemima. Glavni demonstranti Jim Grubb prikazali su fotoaparat FLIR Thermal Infrared Camera Systems koji može mjeriti l
Google Singhal: Govor, prepoznavanje prirodnog jezika među najvećim izazovima pretraživanja
Grafikon znanja, značajka dizajnirana za stavljanje pretraživanja korisnika u kontekst i pružiti prilagođene rezultate, kao i razumijevanje govora, prirodnog jezika i razgovora četiri su najveća tehnološka pitanja s kojima se tvrtka suočava, kaže Amit Singhal, Googleov viši potpredsjednik pretraga.
Microsoft Anna, nova zamjena glasnoće govora u govor, u sustavu Windows 7
To-Speech glasovna zamjena u sustavu Windows Vista i Windows 7. Ranije u sustavu Windows XP ili Windows 2000 imate Microsoft SAM.