依圖首席創新官呂昊12月12日午間消息,近日,人工智能公司依圖科技聯合微軟Azure推出依圖語音開放平臺,并與華為合作,發布智能語音聯合解
依圖首席創新官呂昊
12月12日午間消息,近日,人工智能公司依圖科技聯合微軟Azure推出依圖語音開放平臺,并與華為合作,發布“智能語音聯合解決方案”,將依圖的語音識別技術提供給第三方應用開發者。
依圖與微軟將聯合推出依圖語音開放平臺,是基于微軟Azure云,將語音識別技術能力開放給廣泛的第三方應用開發者。在聯合發布語音開放平臺之后,依圖與微軟還將在智能語音領域展開更深層次的合作,共建AI生態。
依圖與華為聯合發布的“智能語音聯合解決方案”,是基于依圖語音開放平臺及華為全棧全場景昇騰(Ascend)系列芯片和面向數據中心側的Atlas 300 AI加速卡,將雙方的技術研發能力與生態服務能力深度結合,形成軟硬件一體化的聯合解決方案。借助該解決方案,第三方應用開發者可進一步提升開發效率,使用到語音技術。
從目前的市場狀況來看,專攻語音語義技術商業化的先行者有科大訊飛、搜狗,以及云知聲、思必馳等創業公司。但相較于人臉識別的商業化發展速度而言,語音識別的發展仍較為緩慢。大多數識別情況都來自安靜、近場等受限場景。對于電話、語音節目、遠場等更復雜場景,則需要針對性地開發不同模型,但實際應用中的不確定性,使理想和現實仍有較大差距,導致應用場景難以得到更大突破。
依圖首席創新官呂昊告訴新浪科技,在全球最大的中文開源數據庫AISHELL-2中,依圖短語音聽寫的字錯率(CER)僅為3.71%,領先原業內領軍者約20%。此次公開發布相關產品,可以被視為依圖進入了語音識別技術落地的新領域。前景如何,仍有待市場考察。