“倷好呀!”這聲帶著濃濃蘇式韻味的問候,不是來自老蘇州,而是出自蘇州工業(yè)園區(qū)企業(yè)——科大訊飛蘇州分公司最新推出的蘇州方言“AI男主播”。歷經(jīng)7年技術(shù)積累,“他”具有“17000句私藏吳語”的看家本領(lǐng),用地道的“蘇式”聲線,為江南鄉(xiāng)音的數(shù)字化傳承寫下生動注腳。
近年來,方言傳承正面臨困境,調(diào)查問卷顯示,在6到20歲本土出生人群中,蘇州方言使用率占比只有2.2%。科大訊飛始終致力于方言的保護(hù)和傳承,在AI方言技術(shù)方面持續(xù)深耕,研發(fā)團(tuán)隊從方言語料采集、引擎訓(xùn)練起步,逐步構(gòu)建起完整的方言技術(shù)體系,先后實現(xiàn)了訊飛輸入法方言識別、虛擬主播方言播報等功能,最終完成從技術(shù)到產(chǎn)品的跨越。
技術(shù)研發(fā)之路并非一帆風(fēng)順,蘇州方言的復(fù)雜性與獨(dú)特性讓團(tuán)隊在過程中面臨多重挑戰(zhàn):年輕群體中方言流利者不足5%的“聲源之困”;蘇州話存在地域差異、代際差異和“文白異讀”現(xiàn)象的“標(biāo)準(zhǔn)之難”;以及需要破解復(fù)雜變調(diào)規(guī)律和音素邊界的“學(xué)習(xí)之繁”。為攻克這些難題,科大訊飛聯(lián)合方言保護(hù)志愿者、專家顧問及錄音團(tuán)隊,收集了近萬名志愿者持續(xù)4年的語料,完善蘇州方言數(shù)據(jù),最終建成1100余小時識別語料庫和將近17000句合成語料庫,并均完成了精細(xì)化標(biāo)注。
有了扎實的數(shù)據(jù)支撐,此次上線的蘇州方言年輕男聲展現(xiàn)出真實且自然的特點。在小規(guī)模MOS測評中,該系統(tǒng)獲得了4.5分的優(yōu)異成績。這意味著在普通對話場景下,AI說出口的蘇州話已經(jīng)幾乎聽不出機(jī)械痕跡。那些曾讓合成語音露餡的冰冷的“電子味”消失了,取而代之的是自然流暢的方言韻律。
此前,科大訊飛已推出蘇州方言年輕女聲,并成功應(yīng)用于《姑蘇瑣記》AI短片、園林語音導(dǎo)覽等場景。此次男聲的加入,不僅完善了方言AI技術(shù)體系,更為蘇州話傳承開辟了新路徑。
從吳儂軟語的數(shù)字化留存到多元場景的應(yīng)用落地,在園區(qū)這片創(chuàng)新沃土上,科技與文化的融合正綻放出獨(dú)特魅力。未來,這項技術(shù)將應(yīng)用于更多領(lǐng)域,讓AI成為守護(hù)鄉(xiāng)音的溫暖力量。
編輯 黃雨琳
2025年9月1日