全球首屆語音匿名化系統攻擊挑戰賽:奇富科技獲得全球前五快訊
SpecWav-Attack方案在多個語音匿名化系統的測試中,全球首屆語音匿名化系統攻擊挑戰賽由ICASSP 2025大力支持,在全球首屆語音匿名化系統攻擊挑戰賽中。
【TechWeb】1月23日消息,近日,在全球首屆語音匿名化系統攻擊挑戰賽中,奇富科技憑借其 SpecWav-Attack方案,一舉斬獲前五的佳績。
其相關論文/SpecWav - Attack: Leveraging Spectrogram Resizing and Wav2Vec 2.0 for Attacking Anonymized Speech/,成功被頂級學術會議ICASSP2025接收,獲得了國際學術界的認可。
此前,奇富科技另一篇論文/SFE - Net:Harnessing Biological Principles of Differential Gene Expression for Improved Feature Selection in Deep Learning Networks/從深偽檢測防御的角度出發展開研究。
這兩項成果,分別從攻與防兩個維度,為用戶語音隱私保護的研究提供了寶貴的參考依據,更為后續開發更有效的防御機制指明方向。
資料顯示,全球首屆語音匿名化系統攻擊挑戰賽由ICASSP 2025大力支持,堪稱語音隱私安全保護領域的巔峰對決。它吸引了來自全球五十多個國家的數百支頂尖科研團隊踴躍參與,其中不僅有在學術界聲名赫赫的TOP級別學術機構,還有眾多在工業界極具影響力、注重技術實用價值的團隊。各參賽團隊需在極為有限的固定周期內,針對賽方指定的特定語音匿名化系統,開發出高效且精準的攻擊系統,同時還要開發性能卓越的自動說話人驗證系統并提交得分。每支團隊都需要爭分奪秒地優化算法、提升模型性能,競爭的激烈程度可謂空前。
據介紹,奇富科技的SpecWav-Attack方案能夠在眾多強勁對手中脫穎而出,靠的是其在技術上的諸多創新。在創新性數據增強方面,該方案通過垂直調整Mel頻譜圖,巧妙地突出說話人特定音色特征,同時最大程度保留內容相關信息,這一獨特的處理方式極大地提升了模型的魯棒性與適應性,使其在復雜多變的語音環境中也能游刃有余。
此外,增量訓練策略也是一大亮點,先在原始數據集進行初步訓練,再在增強數據集上進行精細微調,有效縮短了模型訓練周期,顯著提高了模型的穩定性與性能表現。此外,與傳統的fbank特征提取方法不同,SpecWav-Attack方案大膽采用自監督的Wav2Vec2.0模型,生成的1024維嵌入能夠捕捉到更豐富、更細致的語音特征,從而在匿名化語音識別任務中實現了質的飛躍。
從實際攻防效果來看,SpecWav-Attack方案在多個語音匿名化系統的測試中,它顯著降低了等錯誤率(EER),尤其是在T10-2系統上,EER降低幅度高達13.82%,這一成果證明了該方案在攻擊匿名化語音系統方面的卓越能力。
從行業影響層面來講,SpecWav-Attack方案如同在語音隱私保護領域投下了一顆“震撼彈”,它有力揭示了當前匿名化語音系統中存在的潛在漏洞,為整個行業敲響了警鐘,進一步強調了加強語音隱私保護防御措施的緊迫性與重要性。
1.TMT觀察網遵循行業規范,任何轉載的稿件都會明確標注作者和來源;
2.TMT觀察網的原創文章,請轉載時務必注明文章作者和"來源:TMT觀察網",不尊重原創的行為TMT觀察網或將追究責任;
3.作者投稿可能會經TMT觀察網編輯修改或補充。