心理聲學(xué)
| A+醫(yī)學(xué)百科 >> 心理聲學(xué) |
心理聲學(xué) 一詞似乎很令人費(fèi)解,其實(shí)很簡單,它就是指“人腦解釋聲音的方式”。壓縮音頻的所有形式都是用功能強(qiáng)大的算法將我們聽不到的音頻信息去掉。例如,如果我扯著嗓子喊一聲,同時(shí)輕輕地踏一下腳,您就會聽到我的喊聲,但可能聽不到我踏腳的聲音。通過去掉踏腳聲,就會減少信息量,減小文件的大小,但聽起來卻沒有區(qū)別。
心理聲學(xué)模型是對人聽感的統(tǒng)計(jì)性質(zhì)的數(shù)學(xué)表述模型,它解釋人各種聽感的生理原理。
心理聲學(xué)模型可以在主觀聽感劣化不多的條件下,大大降低數(shù)字音頻信號傳輸?shù)膸?。它主要基于人?a href="/w/%E5%90%AC%E8%A7%89" title="聽覺">聽覺器官的生理結(jié)構(gòu)和感知模式,通過對數(shù)字音頻信號的相應(yīng)處理,去除不可聞的信號成分及引入不可聞的畸變,達(dá)到普通熵編碼無法達(dá)到的壓縮比率。
由于人耳聽覺系統(tǒng)復(fù)雜,人類迄今為止對它的機(jī)理和聽覺特性的某些問題總是還不能從生理解剖角度完全解釋清楚。所以,對人耳聽覺特性的研究目前僅限于在心理聲學(xué)和語言聲學(xué)內(nèi)進(jìn)行。人耳對不同強(qiáng)度和不同頻率聲音的一定聽覺范圍稱為
聲域。在人耳的聲域范圍內(nèi),聲音聽覺心理的主觀感受主要有響度、音高、音色等特征和掩蔽效應(yīng)、高頻定位等特性。其中響度、音度、音色可以在主觀上用來描述具有振幅、頻率和相位三個(gè)物理是的任何復(fù)雜的聲音,故又稱為聲音“三要素”;而對于多種音源場合的人的耳掩蔽效應(yīng)等特性尤為重要,它是心理聲學(xué)的基礎(chǔ)。
心理聲學(xué)的幾個(gè)基本概念
1、等響度曲線
人的聽覺的靈敏度隨著頻率而改變。即通常兩個(gè)功率一樣但頻率不同的音調(diào)聽起來并不一樣響。通過等響度曲線,我們可以看出,人耳對4KHz的頻率最靈敏,即在4KHz下能被察覺出來的聲音壓力水平(響度),在其他頻率下并不能被察覺。這就給在一些不太靈敏的頻率下失真提供了條件。
2、屏蔽
我們上高中物理時(shí)學(xué)過屏蔽。就是強(qiáng)的聲音信號把弱的聲音信號覆蓋,導(dǎo)致我們無法察覺。而且,當(dāng)兩個(gè)聲音在時(shí)間和頻率上很接近時(shí),屏蔽效應(yīng)就會很強(qiáng)。因此,我們可以在編碼時(shí)對被屏蔽的部分不編碼、不傳送。這樣,音質(zhì)依然沒有大的損失,人耳也不易察覺。
3、臨界頻帶
對于人類的聽覺來說,對聲音的感知特性并不是以線形頻率為尺度來變化的(人的聽覺還沒那么好),而是可以用被稱為臨界頻帶的一系列有限的頻段來表達(dá)。簡單的說,把整個(gè)頻帶劃分成幾段,在這每個(gè)頻段里,人耳的聽覺感知是相同的,即心理聲學(xué)特性都是一樣的。
| 關(guān)于“心理聲學(xué)”的留言: | |
|
目前暫無留言 | |
| 添加留言 | |