WAV 檔案格式問題
纯粹是发现技术上的问题.下载了好几个档案,用一些工具 (Audacity, binary file viewer) 检查了内容, 发现好像有点问题 - 它们跟标准的格式不一样.
1. 090829 与 090831 - 每个档案末都有个 JUNK chunk. 而标准格式的 JUNK chunk 应当岀现在 DATA chunk 前.
虽然这大概不会引至重播的分歧.
2. 092831 与 090904 -在正常的 DATA chunk 内再岀现多一余的 DATA chunk header.
这点比较困难推测对重播的影响. 以 Audacity 来说就把第二个 DATA chunk 的 header 和长度当作音乐数据处理. 当然这祗是等于两个样本 (1 / 44100 份之一秒). PCM 编码有好几种格式。你参照的可能是所谓的标准格式。 真实树欲静而风不止。小白在坛子里投了块石头,赵版想抚平涟漪,不容易啊 ;P
建议楼主搜索“转录”、“抓轨”、“wav”几个关键字,找找被封的帖子。
这是美国斯坦福大学去年冬季 Perceptual Audio Coding 项目的一小段文档,里面简单介绍了标准WAV文件的结构组成和分析方法。
http://ccrma.stanford.edu/courses/422/projects/WaveFormat/
既然2个WAV文件开头不一样,楼主可以以它为参照,完整比较一下2个文件的差异。
如果分析结果是两个文件内容一致,那请看下面内容:
Perceptual Audio Coding 项目去年是由 Marina Bosi 教授带领的。引用该教授的课程 handbook 内容如下:
The need for significant reduction in data rate for wide-band digital audio signal transmission and storage has led to the development of psychoacoustics-based data compression techniques. In this approach, the limitations of human hearing are exploited to remove inaudible components of audio signals. The degree of bit rate reduction achievable without sacrificing perceived quality using these methods greatly exceeds that possible using lossless techniques alone. Perceptual audio coders are currently used in many applications including Digital Radio and Television, Digital Sound on Film, Multimedia/Internet Audio, and Electronic Music Distribution (EMD).
In this course, the basic principles of perceptual audio coding will be reviewed. State-of-the-art audio coding schemes, e.g. AC-3; MPEG Layers I, II, and III (MP3); MPEG AAC; MPEG-4, will be presented. In-class demonstrations will allow students to hear the quality of state-of-the-art implementations at varying data rates and they will be required to program their own simple perceptual audio coder during the course.
课程推荐读物 M. Bosi and R. Goldberg, "Introduction to Digital Audio Coding and Standards", Klewer Academic Publishers 2003.
由此可见,Marina Bosi 教授肯定了人耳有听力上限,并且有实验环境验证这一切,算是能够给出权威答复的人选。
楼主这么执着这一问题,可以联系一下这位教授。以美国斯坦福大学的资源,验证这两个WAV文件是否有音质差异是不在话下的。
M. Bosi and R. Goldberg, "Introduction to Digital Audio Coding and Standards", Klewer Academic Publishers 2003.
该书第一章第一节就说 PCM 编码是最简单的编码。
我查阅了我这里所有的大学图书馆,但都没有这本书可以借。据斯坦福大学说,该书只有斯坦福大学的书店有售。
我没有主动联系斯坦福,主要是怕丢中国人的脸。
我认为大家现在争论的这个WAV问题,在学术上是早有定论的。只是大家都没有接触到这方面的资料。
之前也早有网友指出这其实是认识论的问题。争论下去势必讨论方法论。
我不是扫大家的兴,这个问题在这里是讨论不出结果的。 LS怎么会呢,会有结果的,别着急慢慢说慢慢议早晚会有结果的。地球很早以前不是被说成方的吗,结果还是被椭圆代替直到现在嘛。玩儿嘛,游戏嘛;慢慢来,玩在其里,乐在其中。 抱歉, 我不懂得中文输入法, 加上办公时间长。 花了多天来下载文件, 比较, 然后逐字写了上文。 无意重复, 还请多包函, 先此谢过。
21940528先生, 是我词不达意。 问题不是在 PCM 编码而是那几个档案的格式跟标准 WAV 档案定义有出入。 我说的 JUNK 和 DATA chunks 都是 WAV 档案的格式一部分。
以 090904 来说, right 先生 (Mr Right!) 想制造两个相同的样本, 但是它们却在 byte 781 出现一个 byte 的差别 - 090904A 是 0x60 而 090904B 是 0x70。
因为 776 至 779 的 4 个 byte 刚好是 "data", 初看以为是正式的 DATA chunk 的 header 和长度, 再细看然后发现真正的 DATA chunk 早在 byte 516 已经开始了。 所以 byte 781 的差别实在是声音数据一部分。 用 Audacity 的频谱分析也显示两个样本的开头有微小的差别。 跳过这开头之后, 在正弦波的部分 Audacity 就再找不出差别了。 原帖由 deafdumbblind 于 2009-9-18 21:36 发表 http://bbs.headphoneclub.com/images/common/back.gif
抱歉, 我不懂得中文输入法, 加上办公时间长。 花了多天来下载文件, 比较, 然后逐字写了上文。 无意重复, 还请多包函, 先此谢过。
21940528先生, 是我词不达意。 问题不是在 PCM 编码而是那几个档案的格式跟 ...
Hideafdumbblind,
关于090904文件是我有意识在非声音数据主体出加了一些信息,以说明即使是MD5不同时也一样会有波形完全相同的情形(声音主体);这与WAV格式没有关系,纯属人为。
现将090904中的两文件的人为添加部分删除,变为附件中的090919文件,其中两文件完全相同了;您可看一下。
同时在附件中还贴上了090919-d文件,此文件中的两文件不相同,即MD5不同,仅差1个比特;也可看出虽然MD5不同,但是两文件的声音主体波形是一模一样的,您可以看一下这回不同在何处。 junk既可以出现在data前,也可以出现在data后,一般软件都会忽略掉juck的。
页:
[1]