“這是我們新推出的AI辦公本。得益于人機智能交互語音系統,即便在遠距離或嘈雜環境中,它也能清晰拾音,實現高識別率。”前不久,思必馳科技股份有限公司的“人機智能交互語音系統”入選了“2025蘇州十大產業科技成果”,公司產品總監王艷龍向記者展示了應用該系統的兩項創新產品“AI辦公本”和“無感擴聲吸頂麥”。
賦予機器類人的溝通能力
何為“人機智能交互語音系統”,其核心在于賦予機器類人的溝通能力。
思必馳“人機智能交互語音系統”基于其全鏈路智能對話平臺和語言計算大模型,攻克了復雜噪聲環境下的高精度識別、多輪全雙工對話等關鍵技術難題,性能達到國際領先水平,已廣泛應用于汽車、家居、辦公、教育等領域。
該系統融合了信號處理、語音識別、大模型、語音合成等多項單點技術,思必馳則會根據不同產品的研發需求靈活應用這些技術模塊。例如去年4月發布的“AI辦公本”,便是這樣一款面向辦公會議場景的軟硬件一體化產品。王艷龍介紹,這款產品不僅支持流暢手寫,能呈現彩色類紙效果,還可以自動記錄會議內容、進行語音轉寫、智能提煉重點,并具備圖像拍照功能。此外,它還支持安裝騰訊會議、微信讀書、釘釘等第三方應用,打破了同類產品的功能局限。
“無感擴聲吸頂麥”同樣是該系統的創新結晶,性能不僅比肩國際知名品牌的產品,甚至更具競爭力。其內置128個數字麥克風,運用AI算法進行擴聲,能在三四十平方米區域內,將每個位置的人音自然放大,真正實現無感擴聲的同時還能進行會議記錄。“思必馳人機智能交互語音系統不僅為萬物互聯時代的人機交互提供了中國方案,更實現了真正的智能化。”王艷龍表示。
部分產品持續更新迭代近100個版本
思必馳在軟硬件結合的人工智能技術與產品服務領域深耕多年,于聲音信號處理、語音識別、大模型等方面已有深厚的算法積累與數據積累,這為產品研發奠定了穩固的基礎。
“面對相應領域發展百年的國際品牌,我們的目標絕非追隨,而是實現真正的突破與創新。”王艷龍以服務的復旦大學為例,該校此前長期受困于擴音效果和錄播課程中的雜音問題,傳統廠商數十年未能解決。而思必馳選擇了全新的技術路徑,用軟件算法破局——利用少量數據,就能通過模型和軟件的升級從而有效解決。他表示,無感擴聲和錄播降噪對整個教育領域而言都是新的突破點。
產品持續迭代創新也是思必馳的堅持。“用戶可能只感受到一點點提升,這背后卻是我們投入大量資源進行技術優化的結果。”王艷龍透露,如發布了近一年半的“無感擴聲吸頂麥”,至今已更新了近100個軟件版本。他表示,每更新一個版本都需要不斷進行數據補充、模型優化、算法優化、工程優化等,一整套下來需要很多精力;但想讓一個產品從90分到99分甚至100分,并沒有什么捷徑,只能依靠長時間的專注投入、創新突破。
王艷龍還補充,每個產品的打造都離不開團隊協作。“單無感擴聲吸頂麥這一個產品,思必馳就投入了幾十人的團隊,涉及硬件工程師、軟件工程師、算法測試工程師等多個崗位。”他說,“為了確保極高的品質,我們的工程師甚至會在工廠駐扎一兩個月,只為解決一個細微問題、提升一點效果。”
多項技術指標全球領先
目前,思必馳對“人機智能交互語音系統”的研發與應用已相當深入。據悉,思必馳在汽車、家電領域均布局近十年,在新能源汽車領域的語音交互產品市場占有率為第一;而對辦公會議產品的研發也已持續五年。“我們在多項技術指標上全球領先。比如說辦公會議無感擴聲這個場景下,思必馳的吸頂麥對聲音處理的延遲約為25毫秒,擴能高達12-15DB。”王艷龍說,在該場景下的擴能可以突破10DB的,目前全球范圍內只有思必馳一家。
應用思必馳“人機智能交互語音系統”的產品,往往具有眾多創新功能,因而在全球市場具備領先優勢和廣闊空間。
在進行產品推廣方面,思必馳也很有一套、推出“無感擴聲吸頂麥”時,思必馳就在某全球IT巨頭的培訓教室里進行了近六個月的各類測試驗證,最終在一眾國際品牌中脫穎而出。“客戶選擇我們,其實就是因為我們的產品性能指標過硬、效果卓越,同時我們的服務足夠好。”王艷龍總結道。
對于此次思必馳“人機智能交互語音系統”入選“2025蘇州十大產業科技成果”,團隊深受鼓舞:“思必馳每年都會推出一到兩款突破性的產品。接下來我們還會繼續保持這個節奏,不斷應用AI技術推出創新成果,引領細分領域發展。”