标签:
教育 |
分类: 案头之山水 |
古人写文章,张口闭口“姓孔的那个老头说”,不管什么东西,只要“姓孔的那个老头说过”,就有了不证自明的权威性。到了今天,当“科学”成为了“正确”“先进”的标签,“研究”也就成为了“科学血统”的诊断。不管鼓吹保健品的神奇还是贩卖耸人听闻的传说比如“吃这个会得癌症”“住那里会让人变傻”,“研究表明”都是一个万能的标签。看看报纸杂志电视广播,经常有人说着他们自己都不一定明白的话,在前面加上“专家指出”或者“研究表明”的前缀,似乎所说的东西就变得“正确”起来。
因为我们的文化在传统上没有“科学”这个概念,自然也就没有研究方法的探讨。今天我们所用的研究方法,都是舶来品。这也给了传统崇拜者们一个“拿来”的机会:需要的时候可以“现代科学方法表明”,不需要的时候就“我们的文化不需要西方方法的检验”了。
废话打住,言归正传。这篇介绍现在现代研究中常见的研究方法。
最简单的是cross-sectional
横截数据研究只静态地比较两个人群的差异,而longitudinal study (有人翻译成“动态研究”或者“追踪研究”)则对于某一研究对象进行重复追踪观察。其中常用的有两种方式。一种方式是寻找具有某种症状的人群,比如说某个医院或者某个市的所有有肺癌患者,再找一个不患该病的人群,选择标准是其成员在其它方面和这些患者能够匹配(比如年龄性别收入状况居住状况等等),分别调查他们过去的生活方式,找出明显差异的地方,这样的研究叫做case-control study(病例对照研究)。比如关于豆制品与癌症关系的研究,经常被引用的豆制品能都降低乳腺癌发生率的文献,就是上海的研究者作的病例对照研究。而历史上最成功的例子,是通过这种研究方法提出的吸烟导致肺癌的猜想。病例对照研究比横截数据研究的结果更可靠一些,但是它同样也只能提供一种关联,而不是因果关系。比如豆制品降低乳腺癌发生率的假设,就被后来的实验研究所否定。但是,吸烟导致肺癌的猜想,则被后来的科学实验所证实。还有另一种追踪研究,从某一事件的发生开始追踪某一特定人群的所有人(比如某一个城市出生的所有婴儿),根据某项特征分成两组(比如母乳喂养和配方奶粉喂养),追踪他们的生长发育状况,最后得出母乳和配发方奶粉对各项发育指标的影响。这样的一种研究被称为cohort study,被翻译成“世代研究”“定群研究”或者“队列研究”。研究如果样本量足够大的话,这种研究也可能得到有意义的结果。不过,这种研究同样也存在着问题。比如说,母乳喂养的孩子其母亲能够提供足够的母乳,是否暗示着两组母亲在身体状况或者基因方面有着某些差异?母体的这种差异是否会导致了孩子发育指标的不同?或者,喂母乳的家庭和喂配方奶粉的家庭其经济状况、生活方式是否一致?如果有差异是否会造成婴儿发育指标的差异?
不难看出,以上的这些研究方法都是观察性的。它们的优势在于不对研究对象进行干预,只是基于研究对象的存在状况进行统计分析。这些方法的劣势也是明显的,它们的结果只是一种“伴随”或者“关联”,而不是因果关系。可靠的结论只能来自于实验研究。经过中医存废的的争论,许多人对于“随机双盲对照”实验有了相当的了解。这种研究方法能都提供最可靠的结果,被称为科学研究的“黄金法则”。
其实,“随机”“双盲”和“对照”是不相干的三个概念,并不是所有可靠的实验都需要的。对照是最基本的,没有对照的室验无法阐明效用。比如过用异黄酮减轻女性更年期症状的那个试验,实验组的人在服用异黄酮制剂一段时间后更年期症状减轻了40%-60%,如果按照我们那种“用疗效说话”“几千年的经验证明”的方式,异黄酮无疑是有效的。但是,另一组不服用异黄酮的人也出现了同样程度的减轻。通过这样的对照实验,说明症状的减轻不是异黄酮的功劳。同样,服用另一种药物的那组人,下降的幅度比不服药那组的40%-60%要大,才能真正说明这种药物是有用的。许多单一因素的研究,这样的对照实验就够了。比如说,我们想知道泡菜里加酒精白酒是不是可以让泡菜更酸,只需要把准备好的泡菜原料分成两分,一份加白酒,一份不加,这样的一个对照实验就够了。
随机的使用在于,有很多因素会影响结果。比如说上诉更年期症状的治疗,服用药物只是影响该症状的一个方面。有的人身体素质好(或者别的基因方面的因素),不服用任何药物症状也很微弱;而有的人症状很强烈,服用了药物也很强烈。有的人对药物很敏感,有的人对药物完全没反应。如果有选择地分组,那么想要什么药的结果就有什么样的结果。随机地算选择两组人,对他们发生的变化进行平均,可以消除其它因素的影。可以说,做泡菜的实验可以让对照物和实验物在加不加白酒之外没有区别,而异黄酮那种类型的实验无法实现,只能是用“随机”的两组人取平均来消除其它因素的影响。可以说,“随机”是不得已而为之的事情。
人体实在是个复杂的系统,现在科学对于人体的认识也还只是冰山之一角。对于药物对于人体的作用,心理作用会有相当的影响。双盲实验就是为了消除服药者和施药者的心理作用。在动物实验中,就用不着“双盲”试验。对于食品口味的研究,也不用着双盲,通常只是品尝者不知道的“单盲”。
“随机”“双盲”“对照”,并不需要在所有的实验中贯彻。关键不在于用什么方法,而是在于怎样提供可靠的结论。虽然实验研究可以提供最可靠的结论,但是并不是所有的问题都可以用这些方法来研究。比如说,如果要研究吸毒会不会破坏人的生理机能,或者抽烟能不能让人得肺癌,就无法进行对照实验。人类在伦理上不会允许有可能产生危害的实验在人的身上进行。用人来进行这类研究的是日本的七三一部队,不管发现了什么,都是人类所不能接受的。所以,对于这些问题的研究,只能通过观察性的病例对照等等方法来进行。直接的实验研究,只能在动物身上进行,而动物研究也是被动物爱好者们反对的。
正文完毕,接着废话。
所以,那些观察性的研究也是科学研究的重要手段。它们是“科学研究”,并不是说它们的结论一定是正确的,而是说它们是用具体的数据和理性的逻辑在分析问题。发表的论文只是告诉同行对这个问题进行了什么样的探索,得到了什么样的结果,而不是要得到一个“信念”。很赞成方舟子的主张,搞研究的人应该把研究结果写成论文与同行们交流,也接受别人的检验,而不应该在被专业同行接受认可之前,就打着“研究表明”的旗号去忽悠公众。当我们说“研究表明”的时候,更要关心的是用了什么方法,做了什么样的研究,得到的什么样的数据,这些数据能产生什么样的结论。不仅是普通公众,即使是一些纯粹学文的传媒人士,也往往并不能正确地理解科学研究的内容。“有多少证据,说多少话”说起来很同意,没有相当的科学素养和专业知识,是很难做到的。
由于研究方法的局限性,很多问题经常有互相矛盾的研究结果发表。对于重要的问题,每隔一定时间,主流刊物就会邀请该领域的重要人物综述研究进展。而食物药物的监管机构,再作出一个决定之前,都会组织独立的专家组对该领域的所有研究进行汇总。只有那种全面的总结,才会给出当前对那个问题最全面最可靠的认识。个子说当一个人自称文化人的时候,可能是要骗你的洋芋;当一个人举着“研究表明”的小旗子吆喝的时候,他可能只是要贩卖一些有偏见的观点。尽管,他说的“研究”可能真的能够找到出处。

加载中…