2019-11-15 09:33:17
4038
大家都知道無線對講機可以分為模擬通信技術的模擬對講機(也就是常見的傳統對講機)以及采用數字技術進行設計的數字對講機。數字對講機有許多優點,首先是可以更好地利用頻譜資源。與蜂窩數字技術相似,數字對講機可以在一個頻點上承載更多用戶,提高頻譜利用率。其次是提高通話質量,數字對講機可以在一個范圍更廣泛的信號環境中,實現更好的語音音頻質量?;谶@些特點,使數字對講機成為對講機發展的必然趨勢。
數字對講機語音編碼算法的關鍵技術實現問題可以分為算法實現和硬件平臺實現。算法實現主要是指將低速率語音編碼算法應用于數字對講機,而硬件平臺實現主要是指將改進后的算法正確有效地在硬件平臺上運行。
1
數字對講機SELP語音編碼算法
●算法概述:
SELP算法是建立在傳統的線性預測模型的基礎上,即通過線性預測分析分離激勵貢獻和聲道貢獻,激勵信號則由清音成分和濁音成分在不同時間和不同頻率上的混合組成的,混合信號經過一個慢時變的幅度調制得到激勵信號,其中清音成分用白噪聲很好的擬合,濁音成分在每個諧波處用一個頻率變化的正弦信號合成,整個激勵的濁音部分由一組不同幅度的正弦波信號疊加而成。
●編碼器原理
SELP聲碼器算法屬于參數聲碼器的范疇,此模型描述了5個語音參數,分別是:線性預測(Linear Prediction)系數、清濁音參數、激勵能量參數、基音周期參數和余量譜幅度參數,5 個參數均為每幀提取一次。如下圖所示,是SELP語音編碼器的編碼分析端框圖。
●激勵模型
假設Pn表示濁音成份,Vn表示清音成份, Hn 表示合成濾波器的沖擊響應。則最終的合成語音Xn 可以表示成:
其中 ? 表示卷積運算。
合成濾波器Hn通常采用極點模型來表示。假設Hn用M階的極點模型來表示,其相應的Z變換為:
語音信號中的濁音成份Pn具有周期性,可以看成是一系列正弦波經過幅度調制后相互疊加的結果:
●解碼器原理
所有參數都經過量化編碼傳輸到解碼端,解碼端經過反量化后得到5個參數:線性預測系數、基音周期參數、能量參數、清濁音參數和10維譜幅度參數。采用分析端提取清濁音時的分帶方式,在各個子帶內分別合成激勵。每個子帶中,采用正弦信號合成濁音與白噪聲信號模擬的清音信號疊加,通過合成濾波器后得到合成語音。解碼器的合成框圖如圖所示:
2
數字對講機簡化SELP語音編碼算法
●低復雜度正弦波模型
SELP 算法里將譜幅度參數固定為10維矢量,采用矢量量化傳輸此參數。為了降低編碼器的復雜度,同時節省碼本的存儲資源,簡化后的語音編碼器采用了一種簡單正弦波幅度模型,避免了參數提取和矢量量化過程。
●分子幀參數提取
為了保證低復雜度下的語音合成質量,采用分子幀的方法提取參數。在每個子幀內分別提取基音周期、清濁音信息和能量參數。而線性預測參數仍然在160點整幀內提取,階數設定為10階。
采用自相關方法求取基音周期,每次提取的窗長為200個點,其組成如下圖所示。與整幀基音提取相同,子幀的基音周期也對應于自相關函數的極大值。預留子幀內5個極大值點作為備選基音周期,同時前瞻兩個子幀,通過動態規劃方法得到最終的基音周期。然后將窗向右移動80個點繼續提取下一子幀的基音周期。
基音周期窗
子幀能量參數是基于余量信號進行提取的。語音信號經過LPC逆濾波器后得到余量信號 r(n) ,將余量信號在時間上分為前后子幀,分別計算其能量參數的。
●參數插值
編碼器參數中的線性預測系數、清濁音信息和譜幅度參數,在幀間采用線性插值得到。設過去幀參數記為 par/old ,當前幀參數記為 par/new,則在合成第 k 點語音信號的參數值計算公式如式⑥所示。
對于對數域能量參數,首先將其轉換到線性域按照式⑥進行插值,然后進行激勵的合成。對于基音周期,則按(式⑦)進行插值。
通過幀間插值,保證了幀間語音參數的平穩過度,從而保證了語音的合成質量。
●基于分子幀方法的激勵信號合成
激勵由清濁音信號疊加而成,SELP 算法采用子帶清濁音度對清濁音信號進行調制。清音信號由白噪聲發生器產生,濁音信號由一組正弦諧波信號疊加生成,如式⑧所示。
得到清濁音兩種激勵信號后,分別通過由清濁度信息調制的5個帶通濾波器,相加得到合成激勵信號:
其中 ? 表示卷積運算,hi(n) 表示5個子帶帶通濾波器的沖激響應e/p(n)和e/n(n)分別表示濁音激勵和清音激勵。
將兩種經過增益調制后的信號分別通過由清濁度信息調制的帶通濾波器相加,即得到合成激勵信號。合成激勵信號激勵合成濾波器即得到合成語音。
數字對講機語音編碼算法的硬件平臺實現
●對代碼進行優化的必要性
程序中運算量最大的部分往往是循環,因此對循環的優化效果直接決定整個程序的運算量。如果一條指令需要前一條指令的執行結果,而這時前一條指令的結果還未達到有效狀態,那么處理器就會等待??梢酝ㄟ^調整指令順序的方法來避免流水線等待。另一方面,在函數調用時以及循環體內部這兩個最耗費流水線資源的地方存在大量跳轉語句,而跳轉時會清空處理器的水線,所以在一個循環體內部,應盡可能少出現或者不出現跳轉指令。
●對代碼進行優化的方法
首先是 C 語言級別上的優化,主要的優化方法有:
1、循環的調整。對循環的調整主要是進行循環的展開。由于采用循環則意味著判斷和跳轉,從而耗費大量指令周期,直接采用順序結構雖然使代碼量有所增加,但指令周期數明顯減少。
2、一些函數接口的調整。為了節省寄存器資源,而需要減少傳遞的參數個數??梢灾苯影岩恍┏S玫膮倒潭ㄔ诒徽{函數中,既節省運算量又節省了寄存器。對匯編代碼的優化則牽涉到 ARM 匯編本身的細節:
?、倨谥噶?,雖然指令數增加了,但總的機器周期數可以減少。
②利用指令順序的調整來解決流水線互鎖的問題。這種方法在循環的優化中大量應用。
?、鄢浞掷猛ㄓ眉拇嫫?,盡量避免內存讀寫,從而能夠提高程序的運行速度。
?、芾?ARM 提供的條件執行機制消除部分條件跳轉指令。
2
數字對講機碼率控制算法
圖 1、2、3 分別是“foreman”,“mobile”,“news”各序列使用本文算法和JVT-G012所產生的比特率的比較圖,從各圖中可以看出本文算法在碼流輸出算法更加的平穩。
針對數字對講機的應用環境,改進的低復雜度的 2.4 k 低速率語音編碼算法,對算法進行了簡化,并在 ARM 嵌入式平臺上對目標代碼的實現進行優化。通過采用低復雜度的正弦波模型以及幀間內插等方法降低了算法復雜度,又通過分子幀的參數提取方式以及分子幀的激勵信號合成保證了語音質量;另一方面通過對程序代碼的優化,使得算法能夠在 ARM 嵌入式平臺上達到實用化。通過試驗證明,經過優化后的客觀語音測試結果略微有變化,而主觀聽音效果幾乎未發生改變,但算法的復雜度得到了極大的下降。