聲音超市做後盾,定製化語音合成(TTS)方案亮相雙創周
近日,2018年全國大眾創業萬眾創新活動周開幕,此次雙創週上,北京會場遴選出的300餘家創新型企業帶來的600餘項技術成果均為首次展出。
其中,智慧語音新應用的亮相可以說是本次雙創週上的一個吸睛點,會場上的兩款平易近人的小應用展示了語音合成的新應用場景,揭祕了語音合成技術這一黑科技。
“你說我學”和“今日快聽”兩款小應用,祭出語音合成大旗
語音合成究竟是什麼?在一眾很“直男”的科技產品中,這次雙創週上展出的“你說我學”和“今日快聽”兩款小應用,顯得十分亮眼,各種軟萌、奇趣、自然的聲音融入對話與播報場景,勾起了人們對語音合成技術的好奇心。
“您好,我是星仔,小人物也有大夢想!”周星馳熟悉的聲音在場館中響起。不過,這可不是星爺本人來了,這酷似周星馳的聲音就來自於“你說我學”。
除了“星仔”,點開應用介面,還能看到孫悟空特色合成聲音、臺灣女聲小美、中文兒童冉冉等6個動漫IP形象,滑動到對應人物形象進行點選,說出你想要的話語,人物就會將話語用個性化聲音表達出來。現場一位漢子點選臺灣女聲小美的形象,說出話語後,小美立馬“化百鍊鋼為繞紙柔”,讓其聲音變得甜美起來。
不過,“你說我學”還只是開胃菜,意在通過動漫形象學說話,讓觀眾體驗到語音合成技術的發展已不再是過去生硬冰冷的機器聲音。 而“今日快聽”則是將這些自然生動的合成聲音運用到生活中的重頭戲。
“今日快聽”,是一款通過語音合成(TTS)的聲音來播報新聞的小程式。記者瞭解到,為順應當下快速獲取資訊的需求,今日快聽從網易、億歐、獵雲等眾多優質媒體中選取當日熱門的新聞資訊,將上千字的長篇新聞轉換為一分鐘內的短資訊,用合成語音進行播報。
點開小程式,會看到以黑色為主,紫紅色漸變做裝飾色的主介面,播放新聞時,紫色的唱片圖示就會緩緩轉動。頁面簡潔輕盈、充滿科技風的同時,又融合了中國美學元素。
最獨特的還是播報新聞的合成聲音,作為合成語音播報小程式,“快聽”的聲音並沒有令人窒息的機械感 ,在斷句、重音和聲調等方面都更接近人聲,聲音也更飽滿、具有情感,在聽感上甚至讓人常常忘掉是合成聲音在播報。
除主介面可以進行收聽外,頁面還可左右滑動,進入新聞列表,瀏覽新聞標題和進入新聞閱讀頁面,邊聽邊讀。使用者也可選擇關掉小程式頁面後,繼續收聽新聞,不影響任何其他操作。
“你說我學”和“今日快聽”這兩款小應用,都是將語音合成技術普及到大眾生活中的典型,而這兩個小應用背後,就要正式祭出語音合成這面大旗,看看它到底是如何煉成的。
語音合成是怎樣煉成的?定製化方案+聲音超市
語音識別、語音理解,大家都耳熟能詳了,而形成一個語音解決方案,經歷了前兩步,就到了第三步——語音合成。如果說語音識別相當於“聽得清”的耳朵,語義分析相當於“聽得懂”的腦袋,那麼語音合成就是可以“說得出”的嘴巴。
作為語音解決方案的發聲環節,它能做到讓手機應用、智慧硬體“活”起來。 如百度地圖用志玲姐姐的聲音為你導航、讓教育機器人用童聲為你朗誦,B站小視訊的電子解說也是由語音合成來完成的。
那麼這項技術,究竟是如何實現的呢?
億歐記者近期造訪了國內語音合成行業的中堅力量、也是兩款小應用的開發商——標貝科技,來揭開語音合成的面紗。
以標貝科技的語音合成方案為例,一個聲音要完成定製,需要經歷以下步驟: 首先,要呈現不同音色、不同發音的聲音,需要採用不同領域特定的語料,對語料進行“設計”;之後需要專家指導發音人的說話風格、語調和停頓方式,完成聲音的“採集”;之後,再對聲音的音字、韻律和音節音素進行“標註”;最後,從文字、韻律層級預測、聲學引數和聲碼器方面進行合成。
不過,並不是所有解決方案都需要從頭定製聲音。 此前,標貝科技基於此前語音資料提供商的優勢,已經積累了許多不同音色、不同發音方式的語音庫,這一語音庫也被形象的稱為“聲音超市”。 客戶從“聲音超市”中選擇聲音,無須再經歷定製的流程,便可擁有一套專業的TTS解決方案。據億歐瞭解,今年與標貝科技合作的網易、360就是直接從“聲音超市”中採購聲音的。
目前,TTS處理資料採用深度學習的方式,較為依賴大量的資料做支撐。對此,標貝科技的聯合創始人&CTO李秀林博士也表示,在聲音採集上,要讓發音人長期保持同樣的音色是很難的,不可能對同一個人的聲音進行無限次的採集。因而,標貝科技正試圖減少TTS所依賴的資料量,用更少的資料合成出同樣的效果,甚至可以在更少的資料支援下也可以達到更好的體驗。
更接近人聲,推出IP語音庫
在語音合成中,還有最明顯、也最關鍵的一個問題,就是聲音的自然度。 合成音的自然度直接影響人的聽覺感受,這也是為何目前大多數人對語音合成的印象,還停留在被公交報站、銀行叫號的電子音洗腦的階段。而讓聲音更自然、富有情感和表現力,則需要涉及自然語言處理和聲學建模技術。
“機器看到的是一個個字元,它要把這些字元理解成我們所理解的停頓,甚至‘情感’,然後將文字的特徵變成一個個聲學特徵,進一步生成能讓人聽起來很舒服、自然的聲音,這個技術難度是非常大的”,李博士表示。
(標貝科技的語音合成解決方案)
不過,標貝科技目前在語音合成技術上已經在向更自然、更接近人聲的方案靠近 。此前作為語音產業鏈上游的資料提供商,擁有包含豐富語料的“聲音超市”,也為聲音的情感化表達提供了更好的基礎。在深厚的資料庫資源基礎上,不斷改進語音合成的前端模型,通過高精度自動預處理技術對資料進行處理和建模,實現了具有情感表達能力的合成系統,合成效率可提升30%,穩定性也更好。
基於情感表達上的優勢,標貝科技打造了一系列個性化的定製語音庫,包括自主研發推出了以明星和聲優語音為主的IP語音庫。在與明星經紀公司進行合作中,從對明星聲音進行錄製,到完成聲音定製,1-3個月即可完成。
億歐瞭解到,標貝科技每年會產出上百個音庫提供給合作方。今年已經為客戶提供了150小時的中文女聲情感音庫、350小時的中文女聲音庫、100小時的男生音庫、80小時粵語語音庫、50小時美語女聲語音庫、40小時模仿兒童語音庫以及20小時明星語音庫等。
智慧硬體、客服、有聲閱讀,多場景拓展
“聲音超市”中的各種聲音及定製化的聲音,它們的具體應用場景又在哪裡呢?
目前,語音合成技術已應用在泛娛樂、教育及涉及人機互動業務領域有比較廣泛的應用。
在智慧硬體,尤 其是如今大熱的智慧音箱的應用上,作為智慧家居中越來越受歡迎的中控裝置,使用者對於智慧音箱的聲音已不再滿足於親切、自然的發音,擁有個性化的聲音正在成為消費者購買時佔比逐漸增加的參考維度。對於廠家來說,個性化的聲音也是提高品牌辨識度、快速打造自己的粉絲使用者群的一個新思路。
針對傳統人工客服電話效率低、情緒管理難以把控等痛點,智慧語音客服的優勢也相當明顯。 在音色方面,客戶可針對品牌形象選擇發音人,進行音色定製化服務。親切穩定的情緒,以及專業、標準的話術可以保證使用者較高的滿意度。同時,每天可撥打電話800通以上,提高溝通效率,滿足售後、答疑,主動外呼、營銷等場景。
(標貝科技智慧客服tts方案)
李博士稱,標貝科技的智慧客服tts方案可以達到“通完電話,你都不知道對面是機器人”的效果。
另外,隨著知識付費浪潮的興起,有聲讀物的快速發展讓使用者可以通過手機、智慧音箱、隨身裝置等收聽知識、娛樂、新聞等有聲資訊。 相比人工生產有聲讀物,語音合成技術可提高有聲讀物的生產效率,對新聞的時效性有更強的適應能力。情感合成技術讓聲音更自然真實,人耳的接受度更高,可聽性更強。
而本次展示的“你說我學”和“今日快聽”兩款小應用,則是標貝科技一些最新應用嘗試,也表明語音合成技術還能滲透到更多的生活場景中。
目前,標貝科技已經為喜馬拉雅的小雅音箱、芋頭科技的若琪音箱等產品製作音庫。此外,還與百度、阿里巴巴、騰訊、滴滴、京東、小米、三星、美的、今日頭條、暴風集團、出門問問、搜狗、喜馬拉雅FM等企業進行了合作。
品牌屬性場景加持,將帶來行業爆點
不過雖然已經在智慧硬體、客服、有聲閱讀等領域有所應用,但目前語音合成行業,整體還未完全成熟。李博士也提到,語音合成目前還比較小眾,直到2014年、2015年才逐漸興起。而相對以科大訊飛為代表的在語音全棧解決方案提供商(語音合成作為其中的一個環節)來說,像標貝科技這樣專注於語音合成解決方案的公司並不多。
標貝科技之所以選擇專注智慧語音這一領域,是相信具有個性的聲音會像人的面孔一樣,具有較高的辨識度,未來有更廣闊的發展和應用前景。 特別是對於有聲讀物、智慧硬體、物聯網、機器人等領域,語音合成的加成力量不可小覷。標貝科技認為,個性化語音要成為主流的應用方式,需要這些場景更具備私人屬性和品牌屬性。
私人屬性上,如明星聲音等極具個性化特色和辨識度的聲音在粉絲市場上有較多施展的可能;品牌屬性上,如米老鼠、唐老鴨等具有品牌特色的動畫形象,其聲音特色更適合進行個性化語音定製。
李博士也認為,私人屬性場景的發展,可能會給產業帶來溫和式的增長;而品牌屬性上,對個性化語音的追求,則更可能會帶動整個產業形成爆發性的增長。
在未來,這些個性化語音的市場空間如何,尤其在智慧音箱、機器人等逐漸走入人們生活場景的情況下,專屬的個性化語音是否能成為智慧場景中不可或缺的一環,這些軟萌的、搞怪的、甜美的聲音是否會成為我們的專屬記憶符號,語音合成技術走進智慧生活,還需要依靠語音合成技術以及整個語音行業的不斷向前發展,幫助更多企業找到落地場景。
一直以來,技術都是推動商業環境進化的重要因素,而目前最熱的技術升級趨勢,無疑是人工智慧。當下,儘管人工智慧行業本身已經進入了一個平穩的發展期,但它對於各行各業的賦能卻正在以更熱烈的姿態進行。
2018年11月30日上午,億歐將在北京國貿大酒店舉辦“新技術·新動能創新者論壇”,以技術為核心要素,從行業角度出發,探討新技術趨勢下,企業如何把握升級機會、跟上時代節奏,在諸多競爭者中脫穎而出。
詳情及報名連結: ofollow,noindex" target="_blank">https://www.iyiou.com/post/ad/id/730
版權宣告
凡來源為億歐網的內容,其版權均屬北京億歐網盟科技有限公司所有。文章內容系作者個人觀點,不代表億歐對觀點贊同或支援。