论科学HIFI第二部——研究问题-Blupina

论科学HIFI第二部——研究与感知的问题

适当地使用科学技术将对人的发展有利。但问题在于，什么是“适当”，怎么做才算是“适当”。市场会用自身行动来体现什么是对于市场的“适当”。但这种适当，或许能带来资本，但是否符合实用主义？可以说，这个问题是值得思考的。
虽然很少人看我写的文章，但我对《论科学HIFI、兼谈听音观念与追求》满意。这是因为它主要阐述了家用发烧音响中市场性的“市场”和实用性的“适当”存在的的一些隔阂。如果市场中的某个潮流不符合实用，甚至相悖于实用，那完全有理由怀疑它。

数据的一元论

        关注数据性能本身并不是件坏事，科普科学原理是好事，但要将晦涩难懂的专业知识以有趣、易懂的方式带给群众，并不是一件容易的事。不仅在“讲授”时较易产生勘误，可能讲授者自己的理解都不到位。因此，保持足够的严谨性是重要的。
        查阅数据之前，请思考数据的代表性，相关性、测量方式与依据。数据并不是因素，而是结果。因此，并不能说是某数据特征引发了某现象，而是说某现象的出现使数据产生了对应特征。这么看来，现象必然先于数据，而数据只是富有局限性的抽象化的现象，可以说，对于现象、对于自然，应当保持敬意与不断探索求证的精神。
        分析信号的数据时，可能会归为几种信号或噪声的分量。但当其中一种分量的数据通过一些手段得到了提升，是否产生“拆东墙补西墙”的情况是需要考虑的。
        通信学和HIFI不完全类似。前者可以看作是简化、抽象化的信息处理，因此可以在不高级地应用中简单地分析信号分量。但对于HIFI，到一定程度后（对于我来说，传统家用音响早已达到这个程度），必须考虑并试控制被视为噪声或随机特征等难以分析的部分，而不是简单的一刀切。这就是“音响发烧”，但至于人是否能感知到这些在通信学上难以分析的分量，我将在下文给出我的想法。

真假科学HIFI——实用冲突

        最近，我反复阅读25年的某篇前有关非过采样文章。虽然它分析了多种数据，试图证明当时DSP的缺点，但我认为最有价值的的一句是“（通过对于“PLL时钟和非PLL时钟的对比实验”进行主观评价，认为）相比起（时钟的）总抖动量，抖动模式似乎更加重要”。看起来像是囫囵吞枣的一句猜想，但它可能是影响音质的重要因素。这是一个值得讨论的话题，因为它和“人耳对相位不敏感”这一笼统概念产生了分歧。但可惜的是，我并未找到进一步的研究。知识是网状的，因此我开始学习相关知识，希望能将知识点联系起来，得到进一步的推论。
        对于频率和响度，强调基准测试性能的厂家可能已做得非常好，并越来越好。但频率和响度（包括动态）性能的意义是否重要呢？响度感知是由神经系统中电信号的发射频率决定的，一个电信号会导致突触后细胞电压发生变化，而该变化是呈阶梯式的，因此，可以说人耳对于不同频率的声级感知是以去尾法对信号进行“响度”的舍入。单从这方面看来，就算是“音源是唯一最终参考”的情况，只要使用频域失真低到一定阈值的器材便可以在频域做到理想的感知。
        另一方面，近年来虽然随着实验的更新，THD（总谐波失真）的可听值似乎越来越低。但在以往的很长几段时间中，其参考值基本没有变化，大概是1%或0.01%。我认为，这和现代的测量方法有关。可能在测试时就已经忽视了可能存在的相关复杂性，因而导致了测试的不准确。因此，我猜测THD可听值的逐步降低和实验中THD的调节导致时域特性的改变有关。这么看来，对单独数据变化进行可感知性的实验依然缺乏严谨性。至今，人耳对于声音的感知水平的认知依然不清楚。
        如果问起时域性能，强调基准测试性能的厂家或其工作人员可能会提出或引用诸如“人耳对相位不敏感”等理论来解释它的重要性不强，从而淡化对于时域特性的注重。
        实际上，和数字通信不同，人耳并不存在一个假想的稳定高频计时器用作信号对齐，声音是实时无校验地传输进耳中。而对于时域的认知和两点有关——毛细胞与大脑。毛细胞由接收信号的先后确定信号的顺序，一个毛细胞在一个工作周期中捕捉一个信号，而在声波被毛细胞捕捉到之前，还会经过复杂的耳朵导致的反射、共振等处理；后者直接决定了人的意识，在不同的人的状态的情况下，人对于时间的感知特性也是不同的，例如刚睡醒时会感到时间过得很快，有精神地工作时感觉时间过得较慢。
        虽然耳朵带来的复杂性可能会扭曲声音，但我的猜测是在认知上，人会对其做一个补偿，就像人将眼捕捉到的倒像理解为正像，是一个精细的补偿，而不是一个单纯的模糊。另一方面，就早期学者对“最小可感知声音的鼓膜偏移量”进行了测量，其程度之高令人惊讶。人并不会无依据地进化出自相矛盾的非必要特征，如此看来，此猜测是值得进一步研究的。
        由于人的状态直接影响对于时间的认知，也可以说人自身的对于速度或时间的感知是始终变化的，甚至有可能感知轴本身相对于假想的完美时间轴就呈现一些不恒定的抖动特征。而考虑到人脑的“模糊模型”相关认知习惯，我推测在正常环境中成长的人对于具有普通环境特征的声音应感到比较安心，但如果引入随机程度高的抖动，很有可能不符合已根深蒂固的认知模型，从而本能地强调陌生的特征。
        回到本章开头提到的观点，似乎可以得到一个推论：PLL增加了难以分析规律的（类似于假随机）的抖动，可能让人有失常的感觉。相较之下，传统晶振配合振荡电路输出的单端时钟信号虽然在总抖动量上很可能具有劣势，但其抖动特性较为温和或符合直觉，因此可能从深层意识上就不被认为是一种失常，而被感知为一种平易近人的特征，有利于人的欣赏。而就总抖动量来说，后者可能已经达到了不必解决的程度，从而导致了利大于弊的产生。

统计实验的疏漏

        统计实验是通过观察现象从而概括规律的一种办法，而要点在于选择观察对象，或者说样本的严谨性。由上文“数据的一元论”，我认为最好是和不够严谨的总结或猜想进行结合分析，以达到增加说服力的目的。而对于和高端HIFI相关的统计实验，我认为严谨性欠佳。
        首先，既然是高端的HIFI，那就不能避免吹毛求疵。通常被视为不可闻的特征应当重新审视。可能是由于形而上学的戾气越来越重，很多人会直觉性地首先认为一些变化不值得考虑，但这想法并不符合高端的步法。在社交媒体中流行的多数引用实验，或多或少地缺乏严谨性，请尝试辩证看待每一项实验。此外，盲听实验时经常以“是否有区别”的判断进行统计。而实际上，如果直接地示意受试者做判断，例如问“是否有区别”，其本身已经使受试者的想法发生变化，其固有认知很可能已经隐性或显性地影响到了判断，换句话说，如果在对比统计时，被直接示意的受试者也能做准确判断，那已经可以说其变化不仅超越了最低可察觉的阈值，还使得受试者在较为普通的状态中不可忽视的地步，就不是一种合理的吹毛求疵，而是一种更为基础的统计实验了。
        退一步来说，即便存在正常严谨且本格的对照统计实验，回放系统中某些细节的改变也有可能按一些和回放设备或音源本身相关的规律（或难以分析规律，类似于假随机的）使其优势点（或段）在时域离散化。在这种情况下，可以说只要样本足够，优势将必然出现，而主要分布规律在统计学方面则是重点；同时上文的这种普通严谨程度的实验的结果将易于因其缺乏严谨性而丧失意义。换言之，若更具体、详细地统计“好坏”，通常的严谨程度就很可能不够了，而足够细化的研究又需要极多样本和极谨慎的实验设计才有可能发现规律。考虑到假想实验的可操作性以及行业内时下流行的统计实验与通过其得到的“标准”性质的数据的严谨性，即便不通过横向发展实现弯道超车，也很难通过纵向发展寻求突破。“重新审视”依然非常重要。
        对经典报以尊重，对未来报以谨慎，阻止站队和对立，始终保持和谐。

更新履历：
23.09.14 写毕，第一回发布