Sensory發表供iPhone使用的語音辨識軟體開發工具
iPhone開發人員正在進行內建聲音操作功能的應用
Sensory今天宣佈已經將曾經獲獎的FluentSoft語音辨識軟體開發工具成功的移植到蘋果公司的iPhone平台上。 iPhone開發人員正在開發涵蓋大量辭彙的speaker-independent語音辨識指令及控制功能。運用獨家擁有的以文字為基礎的語音引擎,FluentSoft軟體開發工具可讓包含幾千個字或片語的客製化語音辨識指令集不需透過口語錄製的方式來建立。
FluentSoft軟體開發工具是一個將語音辨識功能寫入動態資料庫應用的理想平台,因為它可將輸入的文字立刻轉換成辨識指令。先進的功能如word spotting、phrase grammars及continuous digit recognition共同運作,消除了使用分散單字的控制指令的限制。這樣創造了更自然的使用者界面,提供了比市場上其它語音辨識產品更進步的功能。
FluentSoft軟體開發工具是以標準的ANSI C語言寫成,包含動態及靜態軟體程式庫、可修改的範例程式、提供建立及調整辨識引擎的應用程式界面、以及一個展示程式來幫助勾勒出最終產品的輪廓。
VoiceActivation.com公司已經使用Sensory的FluentSoft軟體開發工具開發出在iPhone上使用的聲控撥號功能NameDial™,可讓使用者只需說出電話目錄中的名字就可撥出對應的電話號碼,同時提供許多其它聲控撥號應用所沒有的功能及優點。
NameDial™現在已可在蘋果公司的專賣店內供應,它整合了Text To Speech(TTS)技術,可將辨識成功的名字以聲音播放出來,免除了使用者需要觀看手機以確定辨識到的名字是正確的。TTS不僅可播放出辨識到的人名,同時也可播放出屬於該人名的地點(例如,住家、辦公室、手機)。TTS功能將會包含在Sensory未來版本的軟體開發工具內。
Sensory的iPhone軟體開發工具獨特的地方在於它可讓語音辨識直接在iPhone上執行,而不需將資料透過網路回送到一個功能強大的伺服器做辨識。這樣不僅節省了無線通訊的成本同時也縮短了反應的時間,也因此避免將iPhone使用者的個人資料傳送到一個位於任何地點及不確認具有資料保護性的伺服器。
|