发布者:聯誠發 时间:2022-07-15 16:21 浏览量:1738
音視頻中,這樣幾個名詞你需要知道:
(1) 采樣率(samplerate)
采樣就是對一個模擬信號每過一段時間取一個值,采樣的根據是根據采樣定理確定的,即采樣信號的最小頻率不小于被采樣信號帶寬的二倍,否則有原信號就会有所丢失,不再能还原成原来的号,一般采樣信號要比被采樣信號的帶寬大,如间频信號的帶寬是20KHZ,实际采样頻率則爲44.1KHZ.采样就是把模擬信號数字化的过程,不仅仅是音频需要采样,所有的模擬信號都需要通过采样转换为可以用0101来表示的数字信號,示意图如下所示:
蓝色代表模拟音频信號,红色的点代表采样得到的量化数值。
采样頻率越高,红色的间隔就越密集,记录这一段音频信號所用的数据量就越大,同时音频质量也就越高。
根据奈奎斯特理论,采样頻率只要不低于音频信號最高頻率的两倍,就可以无损失地还原原始的声音。
通常人耳能听到頻率范围大约在20Hz~20kHz之间的声音,为了保证声音不失真,采样頻率应在40kHz以上。常用的音频采样頻率有:8kHz、11.025kHz、22.05kHz、16kHz、37.8kHz、44.1kHz、48kHz、96kHz、192kHz等。
(2) 量化精度(位宽)
上圖中,每一個紅色的采樣點,都需要用一個數值來表示大。@個數值的數據類型大小可以是:4bit、8bit、16bit、32bit等等,位數越多,表示得就越精細,聲音質量自然就越好,當然,數據量也會成倍增大。
常见的位宽是:8bit 或者 16bit
(3) 聲道數(channels)
由于音頻的采集和播放是可以疊加的,因此,可以同時從多個音頻源采集聲音,並分別輸出到不同的揚聲器,故聲道數一般表示聲音錄制時的音源數量或回放時相應的揚聲器數量。
單聲道(Mono)和雙聲道(Stereo)比較常見,顧名思義,前者的聲道數爲1,後者爲2
(4) 音频帧(frame)
這個概念在應用開發中非常重要,網上很多文章都沒有專門介紹這個概念。
音頻跟視頻很不一樣,視頻每一幀就是一張圖像,而從上面的正玄波可以看出,音頻數據是流式的,本身沒有明確的一幀幀的概念,在實際的應用中,爲了音頻算法處理/傳輸的方便,一般約定俗成取2.5ms~60ms爲單位的數據量爲一幀音頻。
這個時間被稱之爲“采樣時間”,其長度沒有特別的標准,它是根據編解碼器和具體應用的需求來決定的,我們可以計算一下一幀音頻幀的大小:
假设某通道的音频信號是采樣率为8kHz,位宽为16bit,20ms一。ǖ溃蛞恢∫羝凳莸拇笮∥:
int size = 8000 x 16bit x 0.02s x 2 = 5120 bit = 640 byte