gtlover 发表于 2010-2-21 00:06:45

画在纸上的声音

画在纸上的声音   1.1 振动的传播     音色是由振动方式决定的,数学上可以把振动描述为振动函数,即振动位移(振动点偏离平衡位置的位移)随时间变化的函数,后面几节中我们会着重对振动函数进行研究。   声音的传播过程中,振动会产生在三个地方:   (1) 声源:包括振源和共鸣腔。振源是振动的源头,包括声带(人声)、琴弦(弦乐器)、簧片(管乐器)、鼓皮(鼓)、电磁振盘(扩音器)和其他任何有弹性的材料(噪音)。振源必须由外界提供能量,例如气流、摩擦等,所以振源还不能算是声音的源头。振源的振动是极其微弱的,必须传导给共鸣腔才能发出嘹亮声音,共鸣腔是由弹性材料构成的具有一定体积的腔体。人声的共鸣腔包括咽腔、口腔、鼻腔、胸腔和颅腔,骨骼和软组织起到主要作用;弦乐器的共鸣腔指琴身,通常由木质材料制成;管乐器的共鸣腔则是管子,以金属管占多数,木质的也有。   (2) 传播界质:振动以波的形式传播出去,这种波通常是纵波(传播方向和振动方向相同)。声波的传播界质一般指空气和水,界质中的每一处都在振动,并且向四周发散出去,在发散的过程中衰减。声音的衰减规律是:在空旷的地带,声音总是和声源距离的平方成反比;而在障碍物密集的地方,声音会通过反射和衍射来传播,频率低的声音反射和衍射的能力要比频率高的声音强,所以频率低的声音衰减得慢,传得远,频率高的声音衰减得快,穿透力差。   (3) 拾音器:它是声音真正起作用的地方,对于人的耳朵来说,它是位于中耳的鼓膜和听骨,对于电子录音设备来说,则是话筒中的电磁簧片。

fender325 发表于 2010-2-21 00:08:07

gtlover 发表于 2010-2-21 00:08:48

1.2 声强级
 
  声波的本质是能量的传递,衡量声音强度的指标是拾音器获得的能量,在物理学上,声强被定义为单位面积上声波的功率,即
 
I(声强) = P(功率) x S(面积)
 
  声强的单位为W/m2(瓦/米2),对于人的听觉而言,更为实用的单位是分贝(dB),它反映的是声强级,是对声强的比值取对数而获得的,即
 
L(声强级) = 10 x lg (I / I0)
 
  这里I0是声强级的基准声强,通常选择人耳可以听到的最低声强。由于人耳对不同频率声音的敏感度有所差别,所以这个基准会因频率而有所差别,也是因人而宜的。在测定噪音时,通常用“标准A”来确定基准声强,在1000Hz时其值为10-12W/m2,以此标准得到的声强级计作dB(A)。下面我们举一个例子,以说明声强级的计算:
  在广场音乐会上,前排听众距离小提琴手约5米,这里的声强级为50dB(A),后排听众距离小提琴手约20米,可以估计那里的声强级。由于声强和声源距离的平方成反比,所以后排听众受到的声强约为前排听众的1/16,对这个比值取对数,就可以得到两者声强级的差,即10 x lg (1/16) = -12。所以后排听众感受到的声强级为38dB(A)。在大厅里,我们无法用这种方法计算声强级,因为声波的反射是必须考虑的因素。

gtlover 发表于 2010-2-21 00:11:42

1.3 波形     声音的波形就是振动函数的图像,由于声音传播过程中受外力的作用,波形时刻在发生变化。电子录音和放音设备当中的电路也会导致波形的变化,这种变化称为波形的失真。根据集成电路的特性,每个电路都有最佳的频率范围,例如100Hz到10000Hz,超过这一范围波形就会有很大的失真。很多失真是由滤波电路引起的,例如电路要虑去电网中50Hz的噪音,当接收到的声音在50Hz左右时,波形失真就非常严重了。   此外,最常见的波形失真还有如图1-1所示的过载失真,这往往是由于电信号强度超过电路额定值造成的。 http://orchestra.elephantbase.net/figure_1_1a.gifhttp://orchestra.elephantbase.net/figure_1_1b.gif输入波形输出波形图1-1 波形失真的例子(过载失真)

gtlover 发表于 2010-2-21 00:14:16

1.4 频谱、不可靠原理和不确定原理
 
  振动位移并不会被人的听觉直接感受到,内耳中的耳蜗会自动把振动函数分解成各种不同频率的谐音,高频的谐音会被位于耳蜗边缘感受到,低频的谐音则传递到耳蜗中央,耳蜗内的听觉神经末梢会接受各种谐音。
  谐波是单一频率的正弦函数(或余弦函数),数学上可以通过傅立叶变换(Fourier Transfer)求得振动函数中包含的各种谐波,结果称为频谱或频谱函数,描述了谐波振幅、相位和频率之间的关系。人的听觉无法识别谐波的相位,所以频谱中常常不包含相位信息,这样的频谱称为功率频谱。
  频谱分析是用电子仪器分析声音的科学手段,其原理就是对声音的采样信号进行傅立叶变换。早期的频谱分析仪器主要由滤波电路完成,一个滤波电路只能检测出一种频率的谐波,所以电路复杂,精密度也不高。现在利用电子计算机,声音被转化成采样信号(计算机采集到的振动函数不是连续的,只能每隔一定的时间测量一次信号,这种时间间隔可以用采样频率来描述),计算机运用快速傅立叶变换(FFT)的技术,可以得到频谱。
  快速傅立叶变换可以把N个采样信号转换成N种不同频率的谐波强度,频谱的频率上限和频率间隔有这样的规定:
  (1) 频谱的频率上限就是采样频率(采样时间间隔的倒数),即S = 1/t;
  (2) 频谱的频率间隔就是采样时间的倒数,即T = 1/s;
  (3) 因为T = N x t,所以S = N x s。
  对第一点要作补充说明,频率从0开始到S为止的N个数据并不完全可靠。图1-2可以说明,采样频率大于谐波频率的四倍时,频谱才是可靠的,因为采样信号记录了每一处波峰和波谷(左图);当采样频率小于谐波频率的四倍时,频谱的可靠程度就相当低了,右图箭头朝上的采样恰好记录了每一处波峰和波谷,此时频谱是可靠的,但箭头朝下的采样却都记录了波形的平衡位置,这样的频谱是没有可靠性可言的。
  所以,频谱的检测上限是采样频率的一半,并且频率低的部分比频率高的部分可靠,这就是频谱的不可靠原理。



采样频率是检测频率的4倍
采样频率是检测频率的2倍


图1-2 采样频率和检测频率

  再来看第二点,它的意思是“采样的时间越长,频谱的分辨率就越高”。这句话却蕴涵这另一个意思 测定声音瞬时的频率是不可能的,因为“瞬时”就意味着采样时间极短,这样就会导致频谱的分辨率很差。这就是物理学上著名的不确定原理,也称测不准关系。
  不确定原理不仅仅是频谱的特性,也反映了人耳的听觉状况,对于发音长度不一样的乐器,听出的音准也不同:管乐器和弦乐器可以发出持续的声音,听上去音准感觉很好;钢琴声音会减弱,音准感觉就差一些;打击乐只能发出瞬时的声音,没有音准可言。
  以下是人声(110Hz左右)的波形和频谱,频谱上几乎每个峰都是110Hz的倍数。每个峰的高度(确切地说是峰面积)代表这一频率的强度,峰的宽度说明了频率具有的不确定性。





图1-3 人声的波形(持续时间约0.06秒)



图1-4 人声的频谱(上限约5500Hz)

图见:http://orchestra.elephantbase.net/section_1_4.htm

gtlover 发表于 2010-2-21 00:16:14

1.5 决定音色的要素
 
  声音的性质包括音调(由频率决定,即频谱上的峰位置)、音量(由振幅决定,即频谱上的峰高)和音色。单个谐波的频谱只有一个峰,各种成分谐波的组合就形成了各种音色。以上面的频谱为例,该音色就是若干以110Hz为倍数的谐波的组合。
  音色由振源、共鸣腔和传播界质共同决定。


图1-5 振源的频谱(上限约5500Hz)

(1) 振源和共鸣腔
  通常,振源决定了音的高低(也有例外的情况),但振动方式则必须通过共鸣腔反应出来,振源的振动方式在共鸣腔的作用下发生改变 某些谐波被加强了,某些谐波被削弱了。以人声为例,振源的频谱如图1-5所示(发出110Hz的声音),它的特点是频率越高,谐波的强度越小,这种规律称为谐波的衰减。
  共鸣腔改变了原来的声音(见图1-4) 500Hz和2000Hz附近的谐波都得到加强,而1000Hz到2000Hz这段频率上,谐波被大幅度削弱了。这种性质是共鸣腔的特性,谐波加强的位置称为共鸣腔的共振频率或共振峰。例如,人发出“啊”的声音,共振频率在500Hz和2000Hz附近。
  音色的类型是由振源的特性和共振峰的形状共同决定的。就振源来说,谐波衰减快,音色就很柔和,声音的融合性和穿透力好,例如人声和弦乐器;谐波衰减慢,音色就很坚硬,声音的融合性和穿透力差,例如木管乐器(特别是双簧管和萨克斯管)。就共鸣腔来说,共振峰出现在较低的频率上,音色就暗淡,例如长笛;共振峰出现在较高的频率上,声音就明亮,例如小号。某些音色具有多种特性,例如人声的音色既柔软又暗淡,双簧管的音色既坚硬又明亮,圆号同时具有暗淡和明亮的音色,等等(见图1-6)。



柔软的音色
坚硬的音色




暗淡的音色
明亮的音色



图1-6 振源和共鸣腔的频谱

(2) 声音的传播和音色的穿透力
  声音在传播过程中衰减,这种规律前面已经提到,一是和声源的距离有关;二是和声音的频率有关。所以,声音传播到远处后,不仅音量减弱了,而且音色也变了 高频的谐波消失了,只留下低频的谐波,换句话说,音色会变得柔软和暗淡。人可以辨别出声音是从远处传来的还是从近处传来的,就是依据这个原理。
(3) 噪音成分
  声音在音色上首先可以分为悦音和噪音,悦音在频谱上表现出若干尖锐的峰(如图1-5),噪音的频谱则是杂乱无章的(如图1-7)。在一般情况下,悦音和噪音总是混杂在一起的,只不过成分有所不同,即使是很好的悦音,频谱上也会出现底纹,这种噪音可能来自周围环境,也可能是电子设备干扰所引起的。


图1-7 噪音的频谱(上限约5500Hz)

  在人的语音当中,所有的发音都含有噪音成分。在辅音的发音中,爆破音和摩擦音是两种纯粹的噪音,前者是由于嘴形和气流发生的突然变化而引起的,这种类型的噪音称为瞬时噪音,后者是由于摩擦产生的不规则振动引起的,称为持续噪音。元音的发音中也伴随这两种噪音,声带打开的瞬间气流冲出,产生类似于爆破音的瞬时噪音,气流在声道中的摩擦会产生类似于摩擦音的持续噪音。乐器的发音状况同人的发音是相似的,也含有各种成分的噪音。

图见:http://orchestra.elephantbase.net/section_1_5.htm

gtlover 发表于 2010-2-21 00:17:50

1.6 相位对听觉的影响
 
  波形和音色是有密切关系的,确定的波形具有确定的音色。反过来则不同,同一种音色可能有多种波形,例如下面两个波形:





函数u1的波形
函数u2的波形


图1-8 相位和波形的关系

  这两个波形截然不同,所以傅立叶变换的结果也不同,但频谱却是一样的(s和2s的位置各有两个相同大小的峰),原因就在于功率频谱不记录谐波的相位。人的听觉也是如此,对相位没有感觉,所以这两种波形的声音听上去是一样的。
  对于频率非常接近的两个谐波,相位则会影响到波形的干涉。例如,频率为440Hz的声音和频率为441Hz的声音混合在一起,声音就会因为相位的变化而产生变化 相位相同时音量就会增加,相位相反时音量就会减小,两个频率相差1Hz,相位就以1Hz的频率变化,呈现出强弱起伏的音色,这种现象称为拍。当两个同样的音色产生强弱起伏的声音时,根据拍的原理就可以知道这两个音的高低有差别。


图1-9 拍的波形
http://orchestra.elephantbase.net/section_1_6.htm

gtlover 发表于 2010-2-21 00:20:14

1.7 谐音的相互作用
 
  谐音是由单个谐波构成的音,在频谱上只呈现出一个峰。只发出谐音的乐器是不存在的,谐音只能依靠电子发声器来产生。然而任何普通的音色都由若干谐音组成,这些谐音的频率都是某个谐音频率的倍数,这个谐音称为基音,也称第一谐音,比它高的谐音依次称为第二谐音、第三谐音,等等。例如,钢琴上的c1频率为261.6 Hz,那么这个音就应该有以下的谐音:
谐音
1
2
3
4
5
6
7 *
8
9
10
11 *
12

频率
261.6
523.2
784.8
1046 1308
1570
1831
2093
2354
2616
2878
3139

音高
c1
c2
g2
c3
e3
g3
#a3
c4
d4
e4
#f4
g4



表1-10 谐音的频率与音高

  表1-10还可以延续下去,但更高的谐音音量很弱,仪器也不一定能检测出来。如果测定了钢琴各个谐音的音量,那么用电子发音器发出这些谐音,就可以还原钢琴的音色。
  根据这个原理,几种声音组合在一起,可以得到不同于这些声音的音色。例如,单簧管吹出c1(实音)的同时长笛吹出c2,得到的音色即不同于单簧管也不同于长笛,却像音高为c1的双簧管音色。道理是这样的,把长笛的频谱和单簧管的频谱叠在一起,就很接近双簧管的频谱了。




单簧管(c1,实音)
长笛(c2)
双簧管(c1)


图1-11 木管音色的频谱(上限约5500Hz)

  如果几个声音具有相同的谐音,那么这些谐音可能产生相互作用,形成拍。拍的产生对音色是有害的,当拍的频率超过10Hz时声音就会非常不和谐。两个相差八度的声音频率相差一倍,例如长笛的c2音和双簧管的c1音,它们可能会在523、1046 Hz等频率附近形成拍,一旦吹奏时没有控制好音准,就会产生很不和谐的音色。谐音的频率越大,拍的频率就也就越大,不和谐的程度就越高。根据这个原理,音准对音色的影响有这样几个规律:
  (1) 声音的音调越高,拍的频率就越大,高音的音准有偏差时,不和谐程度更大;
  (2) 声音的音色越亮,高频谐音就越强,亮音色的音准有偏差时,不和谐程度更大;
  (3) 有些吹管只有基数倍的谐音,例如单簧管、排箫和吹瓶,音高相差八度时,不会产生拍,因此不和谐的程度将小得多。
http://orchestra.elephantbase.net/section_1_7.htm

gtlover 发表于 2010-2-21 00:21:52

1.8 二维频谱
 
  二维频谱的一个坐标是频率,另一个坐标是时间,它可以很直观地描述变化的声音,例如一段音乐。下面是《梁祝》中小提琴独奏的旋律:


  图1-12就是由录音转化成的二维频谱,横坐标是时间,纵坐标是频率,颜色的深浅代表谐波的强弱。图上可以清晰地看到小提琴的旋律,波浪形的线条是强烈颤音(柔弦)的结果,画圈的地方是竖琴和单簧管的伴奏。通过对二维频谱的分析,可以把器乐演奏的录音还原成乐谱。



图1-12 二维频谱,横坐标是时间(约10秒),纵坐标是频率(约2800Hz)
http://orchestra.elephantbase.net/section_1_8.htm

gtlover 发表于 2010-2-21 00:23:43

这本手册是本好书,更多内容请点击链接

鲁西亚 发表于 2010-2-21 03:18:10

支持大美女!

JiangYing 发表于 2010-2-21 12:48:22

大美女背后是个大男人...

“时代不同了,男女都一样”,哈哈,一样地支持!

seanhoo 发表于 2010-2-21 14:38:34

其实我小时候喜欢物理
后来还是选了文科

最近看美剧the big bang theory   很有意思
页: [1]
查看完整版本: 画在纸上的声音