2015-05-15 urAD編輯群

[用APP改變世界專題] – 語音指令的應用時代來臨

圖片來源:http://images.bwbx.io/cms/2014-07-10/0710_siri_970.jpg

圖片來源:http://images.bwbx.io/cms/2014-07-10/0710_siri_970.jpg

還在用鍵盤輸入指令嗎?幾年前的語音助理 Siri ,因為能透過聲音辨識指令替使用者完成交辦事項,成為當時轟動一時的新鮮功能。而過去美國Gartner在2012年的新興技術發展報告中也曾提及,在5年內語音辨識技術將成為主流並進入生產穩定期。

隨著行動裝置的便利,漸漸的我們可以發覺生活中不論是旅遊、醫療、金融等領域的語音需求也逐漸增加。 配合著各種行動 App 載具,目前生活各方面的 App 應用都可以透過語音操作,達到更完美的品質。尤其是針對對鍵盤操作較為生疏、或中老年齡層的使用者,這種模式也會加速使用者享受新科技的便利。

以金融服務當為例,美國就有銀行將語音輸入系統與網路銀行 App 做結合。只要透過使用者的聲紋密碼,便可以開始進行銀行帳戶的一連串的任務操作。又從旅遊活動來看,知名團購網 Groupon 則開發出一款語音旅遊導覽 App “Detour”。打著能依使用者速度選定不同導覽速度,並以說故事的敘述方式導覽則成為 Detour 的特色之一。此外 Detour 也以語音導覽,替旅客打造出深度旅遊的體驗!

透過語音輸入指令,便可完成一系列的銀行系列事項。圖片來源:American Banker

透過語音輸入指令,便可完成一系列的銀行系列事項。
圖片來源:American Banker

從這些服務中,我們便可以從中發覺語音互動功能,開啟了更多生活應用的可能。正是因為這股潛力,也讓語音技術開發成為不少科技大產正在努力的方向。 現在就讓我們來看最近有哪些科技品牌在語音服務技術上做出了突破吧!

  • Google

我們都知道Google具有強大的翻譯功能,而Google的翻譯APP則在今年開始提升語音辨識的服務。新的翻譯服務將能自動辨識該使用者所使用的語言,並在語音技術上新增自動雙語翻譯的功能。尤其在雙方使用不同語言進行會議時特別受用!

Google翻譯APP提升語音辨識的服務。圖片來源:Google翻譯

Google翻譯APP提升語音辨識的服務。
圖片來源:Google翻譯

以台灣最普遍使用的中文來說,當對話另一方使用不同語言溝通時,使用者只要透過手機收音,Google翻譯便能直接辨識對方所使用的語言,並翻譯成中文。而在回話時,我們也只要對手機說中文,這款APP便會直接將中文翻譯並播送成對方所使用的語言內容。 值得一提的是,這項翻譯APP可辨識的語言高達九十種。在降低語言隔閡的同時,語音翻譯服務也默默提升各種商務、日常生活的效率,當然對外出至其他國家的旅客,這莫過於是一大相當有助益的小工具!

另一由Google打造的工具Google Now語音智慧助理,擁有自動偵測使用者行為,並提供專屬於使用者習慣及提供建議內容的服務。 為朝更精進的語音技術趨勢發展,Google則在日前宣布這項服務未來將開放第三方APP與客製化的Google Now語音指令服務。而這也說明未來使用者有可能透過Google Now語音指令開啟單一APP,甚至執行某些特殊行為,如播放特定片段的影音內容及圖文等功能。下圖則示範了透過語音指令直接開啟電台收聽的輕鬆服務!

結合Google Now的語音指令服務可完成第三方APP的特定應用服務。圖片來源:http://www.droid-life.com/wp-content/uploads/2015/04/NPR_Full.gif

結合Google Now的語音指令服務可完成第三方APP的特定應用服務。
圖片來源:http://www.droid-life.com/wp-content/uploads/2015/04/NPR_Full.gif

又以首批加入Google第三方app計畫的Shazam為例,我們也能夠發覺同樣是以語音指令做為主要服務,卻也開啟語音應用APP的不同樣貌。

有沒有過突然想到一個片段旋律卻又忘了怎麼唱、又或者是在聽廣播時、或在餐廳裡聽到音樂播放卻又想不起個名的時候呢?

Shazam的語音服務特別處在於它可以從任何音頻中擷取片段旋律,並在經過辨識後,搜尋出該首歌曲的歌名。這款服務除提供ios系統外,最近也開啟了Android服務。當他與Google Now結合時,只要直接透過語音告訴語音助理你想要交付它的任務,手機就能夠自動開啟聆聽的功能。而在提供使用者精準的音樂辨識服務外,它甚至還能直接與影音平台中做連結,提供更直接的使用者體驗。

Shazam除了有音樂歌曲辨識的功能外,也能夠直接將使用者帶入影音平台提供更直接的體驗。
圖片來源:http://www.tecnologici.net/wp-content/uploads/2013/01/shazam-android.jpg

 

  • 微軟

談到語音互動服務,微軟近年在這方面的服務也持續開拓中。Skype Translator便可說是一項在視訊上突破的技術之一。與Google翻譯有著異曲同工之妙,不同的是Skype Translator是運用在即時的視訊通話翻譯。 也就是當使用者以自己的的語言對鏡頭說話時,Skype便會即時翻譯,而對方便會聽到以他的語言所表達出來的聲音。當然,當對方說話時,使用者所聽到的則會是自己所使用的語言。雖然這項服務先前只支援英文與西文兩種語言,值得一提的是它在日前則開始支援中文和義大利文;未來也將繼續提供法德等歐語系國家語言服務。

Skype Translator會即時翻譯對方所表達的內容,並同時紀錄並以智慧人聲翻譯成使用者所能理解語言。圖片來源:http://2.bp.blogspot.com/-9DuYsJELz9E/VJKtYNQxYOI/AAAAAAAAIWI/wVDcO4JETOw/s1600/Watch-Real-Time-Skype-Translator-Preview-as-the-Newest-Addition-to-Microsoft's-VideoConferencing-Platform.jpg

Skype Translator會即時翻譯對方所表達的內容,並同時紀錄並以智慧人聲翻譯成使用者所能理解語言。
圖片來源:http://2.bp.blogspot.com/-9DuYsJELz9E/VJKtYNQxYOI/AAAAAAAAIWI/wVDcO4JETOw/s1600/Watch-Real-Time-Skype-Translator-Preview-as-the-Newest-Addition-to-Microsoft’s-VideoConferencing-Platform.jpg

而另一提到微軟的語音系統服務,不得不提的便是自家的音助理Cortana。除了語音助理就該有的會議提醒、簡訊收發等基本功能,Cortana則是目前在各大品牌所推出的語音助理內,唯一能讓用戶在來電設定提醒的語音助理。例如在特定對象來電時,顯示出要對他所交代的話或相關事項。

當特定對象來電時,Cortana會顯示出要對該對象所提醒的相關事項
圖片資料來源:台灣微軟

此外,在2015期間微軟也進一步將Cortana與第三方APP及語音控制服務做整合。微軟目前便公佈已有超過五百萬組的APP與Cortan進行整合,其中包含租車服務Uber、網路電話Viber,以及購物優惠應用的Shopular等多數熱門的應用程式。而在生活體驗應用中,Cortan更是提供使用者更完善的服務;例如當以Cortana開啟Uber之後,便能一次性的完成呼叫周邊車輛並告知前往目的地點的指示。

從這些科技品牌中發覺,不論是Google還是微軟,他們在語音技術的發展早已不是停留在過去的單一指令動作,而是漸漸地朝多向互動的模式發展。而語音技術的操作運用不僅降低了使用APP的繁雜性,也提供使用者更為效率的服務、加速完成詳盡的使用體驗。

當各廠大動作的開發語音系統服務,甚至是與第三方服務做結合時,更意味著語音技術的運用將更加的多元、面向也將更為廣闊。我們相信,未來的世界除了可以讓使用者簡單的用一張嘴指揮各種APP做不同事情,也將提升各種層面的便利性。當然,語音技術之後的發展與應用又會有哪些大突破,不免讓人懷抱更多期待!

Tagged: , , , , , , , ,