注册 登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

我的博客

就是我的博客

 
 
 

日志

 
 

多媒体通信系统(3.2下)  

2003-09-30 10:50:00|  分类: 默认分类 |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |
Digital video Video is composed of a series of still-image frames and produces the illusion of movement by quickly displaying frames one after another. The Human Visual System (HVS) accepts anything more than 20 Frames Per Second (fps) as smooth motion. Television and video are usually distinguished. Television is often associated with the concept of broadcast or cable delivery of programs, whereas video allows more user interactivity, such as recording, editing and viewing at a user-selected time. 
数字视频  视频是由一系列静止图像画面组成的,这些画面快速地一幅接一幅地显示就产生了运动的幻觉。人类视觉系统(HVS)把任一超过20帧每秒(fps)的运动画面都看作是流畅的。电视和视频通常是有区别的。电视常常与节目的广播、电缆传送等概念相联系,而视频更偏重于与使用者的互动,例如按使用者选择的时间录像、编辑以及观看等。
      The biggest challenges posed by digital video are the massive volume of data involved and the need to meet the real-time constraints on retrieval, delivery and display. The solution entails the compromise in the presentation quality and video compression. As for the compromise in the presentation quality, instead of video with full frame, full fidelity and full motion, one may reduce the image size, use less bits to represent colors, or reduce the frame rate. To reduce the massive volume of digital video data, compression techniques with high compression ratios are required. In addition to throwing away the spatial and color similarities of individual images, the temporal redundancies between adjacent video frames are eliminated.
数字视频带来的最大挑战是巨量的数据和要求实时地复现、传输和显示。解决办法必须在表达质量和视频压缩之间进行折衷。作为对表达质量的折衷,取代视频的全帧、全保真度和全运动,一个办法是减小图像大小,用较少的比特表示色彩,或者减小帧速率。为了减小数字视频数据量,需要高压缩比的压缩技术。另外,为了丢弃在每幅图像之间空间和色彩的相似部分,要除去相邻视频画面之间的时间冗余。
      Digital audio Sound waves generate air pressure oscillations that stimulate the human auditory system. The human ear is an example of a transducer. It transforms sound waves to signals recognizable by brain neurons. As with other audio transducers, two important considerations are frequency response and dynamic range. Frequency response refers to the range of frequencies that a medium can reproduce accurately. The frequency range of human hearing is between 20 Hz and 20 KHz. Dynamic range describes the spectrum of the softest to the loudest sound-amplitude levels that a medium can reproduce. Human hearing can accommodate a dynamic range greater than a factor of millions. Sound amplitudes are perceived in logarithmic ratio rather than linearly. Humans perceive sounds across the entire range of 120 dB, the upper limit of which will be painful to humans. Sound waves are characterized in terms of frequency (Hz), amplitude (dB) and phase (degree), whereas frequencies and amplitudes are perceived as pitch and loudness, respectively. Pure tone is a sine wave. Sound waves are additive. In general, sounds are represented by a sum of sine waves. Phase refers to the relative delay between two waveforms. Distortion can result from phase shifts.
数字音频  声波产生气压振动刺激人的听觉系统。人耳是一种典型的传感器。它把声波变换为大脑神经元可辨识的信号。就像其它音频传感器一样,必须考虑频率响应和动态范围这两个重要因素。频率响应是指媒介能够正确重现的频率范围。人类听觉的频率范围是在20 Hz与20 KHz之间。动态范围描述媒介能够重现的从最轻微到最响的声音振幅级。人类听觉能够适应的动态范围超过数百万倍。对声音振幅的感知是对数性的而不是线性的。人类感知声音的范围达到120 dB,上限是使人感到疼痛。声波可以用术语频率(Hz)、振幅(dB)和相位(degree)来表征,频率和振幅分别被感知为音调和响度。纯音是正弦波。声波是合成的。一般的,声音表现为多个正弦波的叠加。相位是指两个波形之间的相对延迟。相位变化将造成失真。
      Digital audio systems are designed to make use of the range of human hearing. The frequency response of a digital audio system is determined by the sampling rate, which in turn is determined by the Nyquist theorem.
数字音频系统是按照人类听觉范围设计的。数字音频系统的频率响应取决于抽样速率,而抽样速率是由奈奎斯特理论确定的。Example 3.1 The sampling rate of Compact Disk (CD) quality audio is 44.1 KHz. Thus, it can accommodate the highest frequency of human hearing, namely, 20 KHz. Telephone quality sound adopts an 8 KHz sampling rate. This can accommodate the most sensitive frequency of human hearing, up to 4 KHz.
例3.1  CD质量音频的抽样频率是44.1 KHz。因此,它能够满足人类听觉的最高频率,即20 KHz。电话质量的声音采用8 KHz的抽样频率,它能够满足人类听觉最敏感的4 KHz以下的频率。
         Digital audio aliasing is introduced when one attempts to record frequencies that exceed half the sampling rate. A solution is to use a low-pass filter to eliminate frequencies higher than the Nyquist rate. The quantization interval, or the difference in value between two adjacent quantization levels, is a function of the number of bits per sample and determines the dynamic range. One bit yields 6 dB of dynamic range. For example, 16 bits audio contributes 96 dB of the dynamic range found in CD-grade audio, which is nearly the dynamic range of human hearing. The quantized samples can be encoded in various formats, such as Pulse Code Modulation (PCM), to be stored or transmitted. Quantization noise occurs when the bit number is too small. Dithering, which adds white noise to the input analog signals, may be used to reduce quantization noise. In addition, a low-pass filter can be employed prior to the digital-to-analog (D/A) stage to smooth the stairstep effect resulting from the combination of a low sampling rate and quantization. Figure 3.1 summarizes the basic steps for processing digital audio signals [3.4].
在录音频率超过抽样频率的一半时,会造成数字音频混叠失真。解决办法是用低通滤波器滤除高于奈奎斯特频率的成分。量化阶距,即两个相邻的量化电平之间的差值,是每个抽样的比特数的函数,它决定了动态范围。一个比特支持6 dB的动态范围。例如,用于CD级音频的16比特音频提供96 dB的动态范围,已经几乎是人类听觉的整个动态范围。量化样本可以用诸如脉冲编码调制(PCM)等各种格式编码、存储或传输。在比特数过少时会产生量化噪声。在输入模拟信号中加入白噪声,即抖动,可以降低量化噪声。另外,在数模转换(D/A)级前用低通滤波器可以平滑因低的抽样频率和量化造成的阶梯效应。图3.1概括了处理数字音频信号的基本步骤[3.4]。
       The quality of digital audio is characterized by the sampling rate, the quantization interval and the number of channels. The higher the sampling rate, the more bits per sample and the more channels means the higher the quality of the digital audio and the higher the storage and bandwidth requirements.
数字音频的质量可以用抽样频率、量化电平和声道数来表征。抽样频率越高、每个抽样的比特数越多、声道越多,数字音频的质量越高、所要求的存储和带宽越高。
       Example 3.2 A 44.1 KHz sampling rate, 16-bit quantization and stereo audio reception produce CD-quality audio, but require a bandwidth of 44,100x16x2=l.4 Mb/s, Telephone-quality audio, with a sampling rate of 8 KHz, 8-bit quantization and mono audio reception, needs only a data throughput of 8,000x8xl=64 Kb/s. Digital audio compression or a compromise in quality can be applied to reduce the file size.
例3.2  抽样频率为44.1 KHz,16比特量化的立体声接收,产生CD质量的声音,但是需要44,100x16x2=l.4 Mb/s的带宽,电话质量的声音,抽样频率为8 KHz ,8比特量化,单声道接收,需要的数据流量仅为8,000x8xl=64 Kb/s。数字音频压缩以及在质量上的折衷可以用来减小文件大小。
       Integrated media systems will only achieve their potential if they are truly integrated in three key ways: integration of content, integration with human users and integration with other media systems. First, such systems must successfully combine digital video and audio, text, animation and graphics and knowledge about such information units and their inter-relationships in real time. Second, they must integrate with the individual user by cooperatively interactive multi- dimensional dynamic interfaces. Third, integrated media systems must connect with other such systems and content-addressable multimedia databases, both logically (information sharing) and physically (information networking, compression and delivery). 
集成媒体系统仅能实现它们的潜能,如果它们真的在三个关键方式上集成:内容集成、使用者集成以及与其它媒体系统集成。首先,这样的系统必须成功地集成数字视频和音频、文本、动画以及图形,还有关于这些信息单元以及它们之间的关系的实时的消息。其次,它们必须通过协同的多维动态接口与各个使用者集成。第三,集成媒体系统必须与其它类似系统以及目录可寻址的多媒体数据库,在逻辑上(信息共享)和物理上(信息联网、压缩和传输)连接。


  评论这张
 
阅读(135)| 评论(0)
推荐 转载

历史上的今天

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2018