耳机俱乐部论坛

 找回密码
 注册

QQ登录

只需一步,快速开始

手机号码,快捷登录

楼主: 小白

科普文:国外一次有名的盲听实验

[复制链接]

558

主题

2万

帖子

57

积分

禁止发言

积分
57
注册时间
2011-9-29
发表于 2012-2-20 08:02:21 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
我的美女,音响,耳机,游戏,生活博客http://blog.sina.com.cn/athfan
回复 支持 反对

使用道具 举报

62

主题

2451

帖子

27

积分

中级会员

Rank: 3Rank: 3Rank: 3

积分
27
注册时间
2009-7-22
发表于 2012-2-20 16:53:30 | 显示全部楼层
原帖由 小白 于 2012-2-19 22:53 发表




看来你真地认为这两台放大器确确实实是声音没啥区别的了。这就无语了。我再说一遍:这次盲听测试的主办者是Stereophile的主编、主笔、美国hi-end协会的主席等人,他们都仔细在现场听过系统,并且认为这两台放 ...
这个实验和人的认知能力有关,在对参加人员的认知能力没有进行一致化检验前,出来的数据是说明认知能力的分布而已,和器材声音有没有差异没太大关系。
现在对音响的主要争议是器材声音是否有差异,而认为有差异的人恰恰是自认认知能力很强的人,如果这样的人都不能通过盲听测试,器材声音差异的结果就值得怀疑。
没烧过 不折腾
回复 支持 反对

使用道具 举报

62

主题

2451

帖子

27

积分

中级会员

Rank: 3Rank: 3Rank: 3

积分
27
注册时间
2009-7-22
发表于 2012-2-20 17:00:43 | 显示全部楼层
原帖由 来自远方 于 2012-2-20 00:19 发表


等等,3530 个样本呵,不是 505 个,那 52.3% 就已经有一定的参考价值了。

3530 开平方约等于 59,也就是说如果大家都是在“蒙”的话分布结果的方差(σ)值就是 59,所以 1846  个正确答案的意义就是超出平均 ...
原帖由 missingboy 于 2012-2-20 04:56 发表
如果把3530个回答都作为单独的个体,那么其实52.3%和50%在3530个样本下是有很显著的差异的,算出来的p<0.01(如果我算对了的话。。。用z test)但是由于是同一个人作出7次回答,所以个人觉得3530个回答内部是有关联的,所以不知道该用神马检验了。。。  

3530不能当作样本,样本应该是505,missingboy的理解更准一点。没有原始数据,实际没法算。以前做过一个mba毕业生毕业5年后收入调查,样本就是这些毕业5年的毕业生,问题有“哪个学校毕业”“从事什么职业”“年龄”性别“之类很多条,这7个曲目就等于很多不同的问题。最后的样本就是毕业生,但可以计算出毕业学校、职业、年龄、性别和收入的关系。
实验中也有结论了,"弗雷的安魂曲(属于古典)、披头士的歌曲Penny Lane、钢琴独奏,人们就更容易给出正确的回答,而RR公司出品的鼓乐录音,正确率比较低",不同曲目对盲听成功的关系。
没烧过 不折腾
回复 支持 反对

使用道具 举报

25

主题

1414

帖子

21

积分

中级会员

Rank: 3Rank: 3Rank: 3

积分
21
注册时间
2003-5-8
发表于 2012-2-20 22:43:09 | 显示全部楼层
原帖由 pcear 于 2012-2-20 17:00 发表

3530不能当作样本,样本应该是505,missingboy的理解更准一点。没有原始数据,实际没法算。以前做过一个mba毕业生毕业5年后收入调查,样本就是这些毕业5年的毕业生,问题有“哪个学校毕业”“从事什么职业”“年龄 ...


什么叫“假设检验”?“假设检验”就是这样一个数学模型:给出一个“假设”,如在本案中假定两台设备的实际效果是 Same。然后计算实验结果在此假设前提下的概率:如果小概率事件发生,那么我们就认为待检验的假设就被验证为“假”,也就是说二者实际上是 Different,从而实验获得成功;如果所发生事件的概率不够小,那么就不能认为待检验的结果“假”,实验失败,即二者不一定是 Different,也有可能是 Same。

显然,在“两台设备的实际效果是 Same”这个假设前提下,同一人试听不同的曲子和不同的人试听同一支曲子一样,属于彼此独立的同概率(猜对的概率为 1/2)事件。所以,本实验完全符合 3535 个彼此独立同概事件这个条件,也就是说套用前面所述“假设检验”模型的条件是完全可以成立的。
T1、ER4B、DT880/600o、A1、DT990/250o、HD600、G&W2.1、MX500、Elite840、DT931
回复 支持 反对

使用道具 举报

25

主题

1414

帖子

21

积分

中级会员

Rank: 3Rank: 3Rank: 3

积分
21
注册时间
2003-5-8
发表于 2012-2-20 22:52:11 | 显示全部楼层
由于实验结果达不到 2σ 的“一般置信”水平,更达不到 3σ 的“完全置信”水平,所以从假设检验的角度,尚无法认定实验成功,也就是说二者不一定是 Different,也有可能是 Same。

但是,由于超出平均值1.36σ ,这个数值,毕竟还是提供了大量有价值的信息,所以我们可以期待,通过一次设计更严谨,样本更多,分辨更“容易”(如果Difference 确实“存在”的话)的实验,很可能会获得成功。
T1、ER4B、DT880/600o、A1、DT990/250o、HD600、G&W2.1、MX500、Elite840、DT931
回复 支持 反对

使用道具 举报

13

主题

645

帖子

6

积分

初级会员

Rank: 2Rank: 2

积分
6
注册时间
2008-10-26
发表于 2012-2-21 00:31:25 | 显示全部楼层
原帖由 来自远方 于 2012-2-20 22:43 发表


什么叫“假设检验”?“假设检验”就是这样一个数学模型:给出一个“假设”,如在本案中假定两台设备的实际效果是 Same。然后计算实验结果在此假设前提下的概率:如果小概率事件发生,那么我们就认为待检验的假设 ...


如果是听不同的曲子,那么bias要小一些,但是我还是倾向于同一个人做7次回答,由于其自身的听力水平或者对音乐的理解,会造成一些偏差,不如换不同的人来听bias小。
另外,符合正态分布,z=(0.523-0.5)/根号(0.523×0.477/3530)=2.74,对应下来应该是p<0.005了,应该是非常显著了啊。
refresh the joy of flowing melody
回复 支持 反对

使用道具 举报

25

主题

1414

帖子

21

积分

中级会员

Rank: 3Rank: 3Rank: 3

积分
21
注册时间
2003-5-8
发表于 2012-2-21 00:59:00 | 显示全部楼层
原帖由 missingboy 于 2012-2-21 00:31 发表


如果是听不同的曲子,那么bias要小一些,但是我还是倾向于同一个人做7次回答,由于其自身的听力水平或者对音乐的理解,会造成一些偏差,不如换不同的人来听bias小。
另外,符合正态分布,z=(0.523-0.5)/根号( ...

这个不对。如果“同一个人做7次回答”作为单一“事件”,“正确”和“错误”应该如何定义?相应正确率应该如何计算?肯定不会再是 52.3 了。事实上根本无法计算。

另外,你计算方差的公式肯定错了,按你给的随机变量,方差应该是  D = (正确率 - 0.5)^ 2  / 505,或者说 σ = 绝对值(正确率 - 0.5)/ 根号(505)
T1、ER4B、DT880/600o、A1、DT990/250o、HD600、G&W2.1、MX500、Elite840、DT931
回复 支持 反对

使用道具 举报

10

主题

935

帖子

18

积分

中级会员

Rank: 3Rank: 3Rank: 3

积分
18
注册时间
2006-10-12
发表于 2012-2-21 01:10:54 | 显示全部楼层
原帖由 来自远方 于 2012-2-20 22:43 发表


什么叫“假设检验”?“假设检验”就是这样一个数学模型:给出一个“假设”,如在本案中假定两台设备的实际效果是 Same。然后计算实验结果在此假设前提下的概率:如果小概率事件发生,那么我们就认为待检验的假设就被验证为“假”,也就是说二者实际上是 Different,从而实验获得成功;如果所发生事件的概率不够小,那么就不能认为待检验的结果“假”,实验失败,即二者不一定是 Different,也有可能是 Same。

显然,在“两台设备的实际效果是 Same”这个假设前提下,同一人试听不同的曲子和不同的人试听同一支曲子一样,属于彼此独立的同概率(猜对的概率为 1/2)事件。所以,本实验完全符合 3535 个彼此独立同概事件这个条件,也就是说套用前面所述“假设检验”模型的条件是完全可以成立的。


说的没错。不过针对这个实验,我标了红字的部分你的理解刚好反掉了的。应该是,假设:两台设备的实际效果是 Different。

所以在“两台设备的实际效果是Different”这个假设的前提下,3535个事件并不全都是彼此独立事件。

希望我说的能够对你有所帮助和纠正,如果按照你上述的假设,这篇文章会直接被拒掉的。
以这个二月起笔 写一场 婉婉转转的春意 此时 花无需满枝 柳无需新绿 我也无需酝酿 更为温暖的诗句 只在午后 扫一处向阳的坡地 等你 由远及近的马蹄 还是旧年喝过的醅酒 还有 你旧年 一再隐藏的醉意 想必你煮酒的时刻 一直都是微微醉着 否则 你拱手作别的那场北风 怎会以路过的方式 反复与我相遇
回复 支持 反对

使用道具 举报

24

主题

1016

帖子

8

积分

初级会员

Rank: 2Rank: 2

积分
8
注册时间
2009-10-28
发表于 2012-2-21 01:13:03 | 显示全部楼层
原帖由 missingboy 于 2012-2-21 00:31 发表


如果是听不同的曲子,那么bias要小一些,但是我还是倾向于同一个人做7次回答,由于其自身的听力水平或者对音乐的理解,会造成一些偏差,不如换不同的人来听bias小。
另外,符合正态分布,z=(0.523-0.5)/根号( ...


到几千这种规模的样本,即使数值上只差一点点,结果也很显著呢。看图:

plot1.jpg
回复 支持 反对

使用道具 举报

24

主题

1016

帖子

8

积分

初级会员

Rank: 2Rank: 2

积分
8
注册时间
2009-10-28
发表于 2012-2-21 01:18:01 | 显示全部楼层
不过我有点疑惑:检验这两个器材是same或者是different的意义是什么?这个实验不是在已知两个器材different的情况下研究听众的辨别能力么。
回复 支持 反对

使用道具 举报

25

主题

1414

帖子

21

积分

中级会员

Rank: 3Rank: 3Rank: 3

积分
21
注册时间
2003-5-8
发表于 2012-2-21 01:28:03 | 显示全部楼层
原帖由 chen0706 于 2012-2-21 01:18 发表
不过我有点疑惑:检验这两个器材是same或者是different的意义是什么?这个实验不是在已知两个器材different的情况下研究听众的辨别能力么。


不知道你说的已知 different 制的是什么意思?数据指标?
T1、ER4B、DT880/600o、A1、DT990/250o、HD600、G&W2.1、MX500、Elite840、DT931
回复 支持 反对

使用道具 举报

4231

主题

10万

帖子

3765

积分

版主

俱乐部理事

Rank: 10

积分
3765
注册时间
2001-11-21

优秀版主奖耳机鉴赏奖社区建设奖

 楼主| 发表于 2012-2-21 09:52:01 | 显示全部楼层
这个盲听的目的,我个人理解是,验证两台“不同的放大器”之间的声音差异,是否能被人们普遍地认知。不是被某一特定人认知,而是检验能否被人们“普遍地”(general sense)认知。所以才取了较大的样本。
安润上海店:http://anrun.taobao.com
小白的新浪博客: http://blog.sina.com.cn/headphoneclub
欢迎订阅微信公众号“耳机俱乐部小白版主”
B站频道:http://space.bilibili.com/232721015
回复 支持 反对

使用道具 举报

28

主题

388

帖子

1

积分

初级会员

Rank: 2Rank: 2

积分
1
注册时间
2011-3-9
发表于 2012-2-21 12:30:18 | 显示全部楼层
“不同的放大器”之间的声音差异,多数发烧友还是能够听出来的。
NuWave+LM211IA+LS50
回复 支持 反对

使用道具 举报

62

主题

2451

帖子

27

积分

中级会员

Rank: 3Rank: 3Rank: 3

积分
27
注册时间
2009-7-22
发表于 2012-2-21 12:30:48 | 显示全部楼层
原帖由 小白 于 2012-2-21 09:52 发表
这个盲听的目的,我个人理解是,验证两台“不同的放大器”之间的声音差异,是否能被人们普遍地认知。不是被某一特定人认知,而是检验能否被人们“普遍地”(general sense)认知。所以才取了较大的样本。
我也觉得这个假设才是初衷,和器材没什么关系。因此假设应该以人为对象,不应以器材为对象。样本也是以人为对象,不应以曲目为对象。
要检验器材的差异,找一个人盲听就可以达到足够置信度,用不着这么多人,人越多反而越离散。
没烧过 不折腾
回复 支持 反对

使用道具 举报

62

主题

2451

帖子

27

积分

中级会员

Rank: 3Rank: 3Rank: 3

积分
27
注册时间
2009-7-22
发表于 2012-2-21 12:34:50 | 显示全部楼层
原帖由 双解码 于 2012-2-21 12:30 发表
“不同的放大器”之间的声音差异,多数发烧友还是能够听出来的。
盲听未必。
没烧过 不折腾
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

耳机俱乐部微信
耳机俱乐部微信

QQ|联系我们|有害信息举报:010-60152166 邮箱:zx@jd-bbs.com|手机版|Archiver|黑名单|中国耳机爱好者俱乐部 ( 京ICP备09075138号 )

GMT+8, 2025-2-21 20:04 , Processed in 0.108811 second(s), 38 queries , Gzip On.

快速回复 返回顶部 返回列表