聲加科技攜語音前端解決方案亮相“2018西安全球硬科技產業博覽會”
11月8日,以“硬科技發展西安,硬科技改變世界,硬科技決勝未來”為主題的“2018西安全球硬科技產業博覽會”在西安市曲江會展中心隆重開幕,並於當日上午九點正式對外開放。作為2018全球硬科技創新暨“一帶一路”創新合作大會人氣最高、最受關注的活動之一,將持續至11日的博覽會上有近300家企業參展,預計總參展人數超過8000人。
2018西安全球硬科技產業博覽會現場
據悉,本屆博覽會展覽總面積達2萬平方米,共設定中國科學院、國防科工、軍民融合、硬科技“八路軍”(光電晶片、資訊科技、生物技術、人工智慧、智慧製造、航空航天、新能源、新材料)等15個主題展區,參展單位包括硬科技領域相關的國際企業,硬科技國內知名企業、獨角獸企業,大型集團企業,中科院系統、國防科工系統,西安市各開發區、重點高校院所、硬科技龍頭骨幹企業,以及20個國內城市和5個國外友好城市代表團,集中展示硬科技“八路軍”產業發展代表性企業及成就為重點的國內外硬科技領域前沿新技術、新產品。
其中,來自中科院聲學所、專注於聲學前沿技術和語音互動的科技創新公司——聲加科技,攜其多麥克風遠場拾音解決方案,包括高效能6麥克風陣列模組以及低功耗3麥克風陣列模組,亮相博覽會中科院主題展區。雖然展會現場的噪音環境非常嘈雜,廣播、人聲、混響、回聲等干擾源使得現場的平均噪音在80dB左右,但是聲加所展示的拾音模組仍然在3米的距離可以很容易的被喚醒,吸引了一大批參展觀眾前來互動,現場同時展示了聲加科技的近場拾音方案代表作品之一藍芽耳機語音增強演算法的原理以及應用。
工作人員為物聯網企業高管講解產品
作為硬科技的代表性企業,成立於今年1月的聲加科技是一家致力於解決全場景下的語音前端處理技術型新興創企。其專注於通訊聲學核心技術,依託中科院聲學所雄厚的人才和科研資源,以產學研一體化為全場景使用者提供軟硬一體化的語音前端拾音解決方案,包括麥克風陣列的演算法、模組以及麥克風陣列, 關鍵詞喚醒(KWS)以及喚醒詞定製訓練 模型。並可提供產品設計等定製化方案以幫助使用者加速產品上市。
據其CEO邱鋒海介紹,從上世紀50年代,語音識別從單一模式匹配到70年代的模式和特徵分析,再到90年的統計方法(HMM+GMM),直到2010年後,深度神經網路(DNN)取得了巨大的成功,基於DNN技術的應用也呈爆炸式增長。同時,語音識別、自然語言理解、語音合成效能等技術大幅提升,網際網路、移動網際網路的高速發展也為演算法引擎提供了大量的資料“糧食”。在海量的資料紅利下,雲端計算軟硬體系統的算力增長使其能夠快速處理海量資料,再加上邊緣計算的能力增強、功耗降低等因素,語音互動的“基礎設施”已逐漸成熟。因此,智慧語音互動應用的興起也就順理成章。
隨著巨頭們對智慧音箱和智慧耳機的不斷投入,智慧語音產品已經越來越被人們熟知。作為智慧聽覺的引領者和創新者,聲加科技主要團隊來自於中科院聲學所、清華大學、南京大學和中國科學技術大學等國內一流科研院所。核心團隊成員亦大多師出中科院聲學所,平均在業界擁有超過十五年工作經驗,博士以上學歷人員佔比80%以上。核心技術包括回聲消除ACE(支援單聲道和立體聲回聲消除)、混響抑制(去除房間混響導致的語音拖尾)、聲源定位(利用麥克風陣列,實現360度全方位語音訊號採集,並通過聲源定位來確定目標說話人的方向)、定向拾音(在保護主方向語音的同時,去除環境中的語音、電視噪聲等非平穩干擾)、噪聲抑制(去除空調、胎噪等平穩噪聲以及環境z紅的語音、電視等非平穩噪聲的波束成形演算法)、關鍵詞喚醒KWS(支援Dual-wake、Free-out、One-shot等獨有的定製功能,同時支援多倫對話功能)。
聲加科技展出展品
目前,聲加科技可為B端客戶提供複雜場景下的近場、中場、遠場語音互動技術方案,以及從晶片、模組、PCBA到工業涉及的一站式產品方案。邱鋒海表示,10萬年前,語言的出現大大加速了人類社會進化和發展的程序。時至今日,聽和說依然是人類最基本、最常用和最靈活的交流方式,同時也是最好的人機互動方式。在經歷了計算機命令式互動到圖形介面觸控互動,再到資訊時代/高階資訊時代的自然互動、和情感互動…… 毫無疑問,語音互動將會成為泛在的人機互動方式。 聲加科技將一如既往的致力於在複雜聲場景下,為人與人通訊、人與機器互動提供更清晰、更舒適、更自由的使用體驗,最終實現人機完全交融的願景。
據悉,本次本屆博覽會分別在A館和B4館舉行,兩館面積分別超過10000平米。其中,A館以特裝和集中展示為主,B4館則採用特展+標準展位結合。展出產品均為最“硬”、最“炫”、最“前沿”的技術成果和產品,期間還伴隨參展企業的新品釋出會、主題演講、產品演示、技術解析、現場推介、合作洽談等主題活動,是硬科技領域當之無愧的頂級盛宴。