世界網際網路大會 | 搜狗與新華社聯合釋出 AI 主播
據 ofollow,noindex">新浪科技 報道,搜狗公司 CEO 王小川、新華社副社長劉思揚、搜狗公司智慧語音事業部總經理王硯峰和主持人邱浩在第五屆世界網際網路大會上聯合釋出 AI 合成主播。
AI 合成主播由“搜狗分身”技術打造,通過人臉關鍵點檢測、人臉特徵提取、人臉重構、脣語識別、情感遷移等多項技術,把更接近人類的形象呈現出來。結合語音、影象等多模態資訊進行聯合建模訓練後,生成與真人無異的 AI 分身模型。
這項技術可以讓機器模擬出逼真的人類聲音、嘴脣動作和表情,並將三者自然匹配。
使用者需要做的只有輸入新聞文字內容,AI 合成主播將可以用類似真人的聲音進行播報,並且讓畫面中 AI 主播的脣形、表情與真人吻合。
根據此前的報道,搜狗在第三季度 全面升級了語音識別模型 ,使中文語音識別錯誤率下降 20% 以上,中英文語音混輸錯誤率下降 50% 以上。
圖片來自 新浪科技