1950 年的 Doll 与 Hill 论文,后来常被记成医学第一次终于知道香烟会导致肺癌的时刻。这个记忆方向没错,文件本身却更细,也更硬。若把论文重新慢慢读一遍,会发现它完成的关键动作,并非一记情绪很重的反烟宣判,而是把吸烟从轶事、道德判断和都市疑云里抽出来,改写成流行病学可以计数的对象:一种可以按剂量分层、可以和匹配对照比较、可以逐条测试偏倚解释、又能和特定疾病模式相连的暴露。[1]

这也是这篇论文直到今天仍然重要的原因。它的论证很有力,却没有莽撞到把一项医院病例对照研究写成因果终局。Doll 与 Hill 先展示真实关联,再展示关联会随着吸烟量上升而增强,再展示这种关联主要落在肺癌而并非一般医院疾病上,最后把剩下那层推断边界保留在纸面上。[1] 后来的英国医生随访研究与 1964 年美国外科医生总监报告,才把这层边界进一步压实,变成制度层面的因果判断。[2][3][4] 1950 年真正发生的转折,更早一步,也更基础一步:吸烟第一次被写成可测量的暴露。

题图使用的是 1979 年美国国家癌症研究所拍摄的 Richard Doll 档案肖像。它放在这里是合适的,因为这篇文章讨论的是流行病学如何形成一种新的看法,而并非借通用香烟图像制造后见之明。[5]

先把时间锚点钉住

1. 这篇论文真正搭起来的,是分母

1950 年论文最强的地方,并不在修辞,而在设计。Doll 与 Hill 没有只依赖某一位名医、某一家知名诊所或一堆死亡证明。他们组织了来自 20 家伦敦医院的病例通知,再让经过训练的访谈员,使用同一套问卷去访问癌症患者与非癌症对照。[1] 每一位肺癌患者,都对应同院、同性别、同五岁年龄组、又在相近时间接受访问的一位对照。[1] 这个匹配动作,才是整篇文章真正的引擎。

它为什么重要,放回当时语境就很清楚。20 世纪 40 年代末,肺癌暴增的公共讨论里塞满了松散嫌疑人。城市空气、柏油路面、煤烟、工业排放、汽车尾气,都在因果图景里。[1] 如果论文只是说肺癌病人里很多人吸烟,它不过是在嘈杂场里再多丢进一条印象。把对照匹配起来之后,问题才真正换了:并非“肺癌病人吸不吸烟”,而是“和可比的其他病人相比,他们吸得是否不同”。正是在这里,习惯开始变成暴露。

论文还有一个今天读来仍然很现代的地方,就是它对自身薄弱处的处理方式。各医院通知方式不同;有些合格患者在访谈前已经出院、病重或死亡;居住地并没有完全匹配。作者没有把这些地方藏起来,而是逐条写出,再讨论这些问题是否足以推翻结果。[1] 这一点很要紧,因为这篇论文留下来的,不只是结论,还有一种方法气质:偏倚并非要绕过去的障碍,而是要公开检验的对象。

2. 表格真正完成的工作,是把吸烟写成剂量模式

这篇论文里最常被引用的数字,的确值得一直被引用。在男性肺癌患者中,非吸烟者只占 0.3%;在男性非癌症对照组里,这个比例是 4.2%。[1] 这个差异已经很醒目,但它还并非论证真正最深的一层。更关键的是剂量。男性肺癌患者中,有 26.0% 落在最高两档消费组,也就是每天 25 支或以上;对照组里,同一档只占 13.5%。[1]

正是这一步,让整篇文章开始有了现代感。吸烟在这里已经并非一个“抽还是不抽”的道德性格标签,而是一条梯度。作者甚至进一步尝试,以大伦敦人口为参照,做出非常谨慎的相对风险估计。以非吸烟者作为基准,他们推得风险比会随着日吸烟量不断上升,依次来到 619264965,同时又明确提醒读者,这些并非最终人口风险,只是带着假设条件的比例估计。[1] 这种保留很重要,数字形状本身同样重要。到 1950 年,论文已经把剂量反应这件事相当清楚地写在纸面上。

也正是在这个层面上,这篇论文和宽泛的反烟议论分开了。它没有要求读者因为肺癌患者中很多人吸烟而受到情绪冲击;它要求读者看分布如何随着疾病状态改变。这是一种流行病学的观察习惯。吸烟一旦被排成剂量档,再放进对照比较里,争论就不再只停留在恶习、风尚和都市生活的层面,它开始进入表格。

3. 最容易被后人记错的,恰好是讨论部分的节奏

论文结尾的讨论值得慢一点读,因为最有力量的地方和最有分寸的地方刚好并排出现。Doll 与 Hill 说,这种关联是真实的;他们又说,从比较组来看,这种关联主要针对肺癌,而并非其他癌种或一般呼吸系统疾病。[1] 接着,他们停了一步,写下那句后来常被忽略的话:这“并不用然意味着吸烟导致肺癌”。随后作者才把几种替代解释逐一推开,并排除“疾病本身反过来造成吸烟习惯”的或许。[1]

这段文字并非虚弱的退让,而是在展示推断过程本身。论文已经强到足以排除若干容易的逃生路线,却仍然把“关联”与“因果”的差别留在读者眼前。直到这些路径走完之后,他们才写下真正有历史重量的那句判断:吸烟是肺癌发生中的一个因素,而且是一个重要因素。[1]

后来很多转述会把这一层压扁,要么写成一道雷霆般的终局宣判,要么写成一篇仍然模糊的旧文。更贴近原文的理解,是把它看成一条被控制得很稳的上升路径。先谈关联真实,再说关联具有特异性,再说反向因果说不通,再说跨越 20 到 50 年的共同原因设想并不合理,最后才把判断推到“重要因素”。也正因为这样,这篇论文后来没有显得轻率。它的谨慎,本来就是它力量的一部分。

4. 为什么 1950 年还并非整场裁决

如果 1950 年这篇论文孤零零停在那里,它依然会重要,只是重要的方式会不同。医院病例对照研究可以抓住极强的模式,却无法单独解决所有关于代表性、总体基线与长期风险的问题。也正因为这样,后续几步才会在这篇细读里显得格外关键。

1954 年那篇关于英国医生死亡率的初步报告,把证据方向改掉了:研究不再只回头比较患病者与对照,而是先记录医生的吸烟习惯,再往后看死亡结果。[2] 后来发表的 50 年观察论文,又把这种设计的耐久性完整写了出来:一篇短文里的疾病关联,最终长成横跨几十年的死亡率记录。[3] 到了 1964 年,美国外科医生总监委员会面对的已经不再是“这里是并非有一个值得注意的可疑关联”,而是“累积的流行病学证据是否已经跨过公共卫生因果判断门槛”。那份报告给出的回答是肯定的,并把问题推进到警示、监管与预防的制度语境里。[4]

沿着这条顺序回看 1950 年的论文,比较稳妥的理解就会浮出来。它最大的贡献,并非独力完成最终证明,而是搭出一套足够坚固的测量语法,使得后来的队列证据与制度审查能够在其上继续延伸,而并非另起炉灶。它教会了公共卫生系统如何用定量语言谈论吸烟。

为什么今天仍值得细读

Doll 与 Hill 这篇论文直到今天仍然有解释力,因为它展示了一件事:重大健康因果关系,往往在机制尚未完全闭合之前就开始变得可见,但前提是暴露已经被写成可以计数的对象。[1][3][4] 这篇文章读起来不像檄文,更像一台在压力中慢慢搭起来的统计装置:把对照匹配好,把偏倚质疑一条条检验,把习惯拆成剂量,再在维持边界感的同时,说出证据已经能够承受的判断。

真正的历史转折也正落在这里。吸烟在 1950 年变得重要,并非因为某篇论文突然让香烟显得更不道德,而是因为它第一次被写成可操作的暴露。后面的几十年会补上长期随访、政策机器和社会斗争;1950 年这篇论文补上的,是语法本身。

来源

  1. Richard Doll 与 A. Bradford Hill,"Smoking and Carcinoma of the Lung: Preliminary Report",《British Medical Journal》(1950 年 9 月 30 日),扫描 PDF。
  2. Richard Doll 与 A. Bradford Hill,"The mortality of doctors in relation to their smoking habits: a preliminary report",PubMed 记录页(1954 年)。
  3. Richard Doll、Richard Peto、Jillian Boreham 与 Isabelle Sutherland,"Mortality in relation to smoking: 50 years' observations on male British doctors",《Journal of Epidemiology & Community Health》/ PubMed Central(2004 年)。
  4. 美国国家医学图书馆 Profiles in Science,"The 1964 Report on Smoking and Health"。
  5. Wikimedia Commons,"File:Doll, richard.jpg":本文题图所用的美国国家癌症研究所肖像照片页面。