当吸烟变成可计量暴露：细读 Doll 与 Hill 1950 年那篇肺癌论文

这张美国国家癌症研究所的档案照片适合本文，因为文章讨论的是 Richard Doll 如何把吸烟从模糊的社会习惯改写成可以计数的暴露。

1950 年的 Doll 与 Hill 论文，后来常被记成医学第一次终于知道香烟会导致肺癌的时刻。这个记忆方向没错，文件本身却更细，也更硬。若把论文重新慢慢读一遍，会发现它完成的关键动作，并非一记情绪很重的反烟宣判，而是把吸烟从轶事、道德判断和都市疑云里抽出来，改写成流行病学可以计数的对象：一种可以按剂量分层、可以和匹配对照比较、可以逐条测试偏倚解释、又能和特定疾病模式相连的暴露。[1]

这也是这篇论文直到今天仍然重要的原因。它的论证很有力，却没有莽撞到把一项医院病例对照研究写成因果终局。Doll 与 Hill 先展示真实关联，再展示关联会随着吸烟量上升而增强，再展示这种关联主要落在肺癌而并非一般医院疾病上，最后把剩下那层推断边界保留在纸面上。[1] 后来的英国医生随访研究与 1964 年美国外科医生总监报告，才把这层边界进一步压实，变成制度层面的因果判断。[2][3][4] 1950 年真正发生的转折，更早一步，也更基础一步：吸烟第一次被写成可测量的暴露。

题图使用的是 1979 年美国国家癌症研究所拍摄的 Richard Doll 档案肖像。它放在这里是合适的，因为这篇文章讨论的是流行病学如何形成一种新的看法，而并非借通用香烟图像制造后见之明。[5]

先把时间锚点钉住

1922 年到 1947 年： Doll 与 Hill 在论文开头指出，英格兰与威尔士被归因为肺癌的年度死亡人数从 612 上升到 9,287，增幅大到无法只用人口增长解释。[1]
1948 年 4 月到 1949 年 10 月： 研究团队在伦敦医院展开访谈，最终把 649 名男性肺癌患者与 649 名非癌症对照按性别、年龄组、医院与访谈时间做匹配比较。[1]
1950 年 9 月 30 日： 这篇 BMJ 论文发表，把吸烟和“空气污染”这一竞争解释放进同一论证框架。[1]
1954 年 6 月 26 日： Doll 与 Hill 发表英国医生死亡率初步报告，证据方向从医院病例对照转向前瞻性随访。[2]
1964 年 1 月 11 日： 第一份美国外科医生总监吸烟报告发布，证据由学术判断推进到正式公共卫生结论。[4]

1. 这篇论文真正搭起来的，是分母

1950 年论文最强的地方，并不在修辞，而在设计。Doll 与 Hill 没有只依赖某一位名医、某一家知名诊所或一堆死亡证明。他们组织了来自 20 家伦敦医院的病例通知，再让经过训练的访谈员，使用同一套问卷去访问癌症患者与非癌症对照。[1] 每一位肺癌患者，都对应同院、同性别、同五岁年龄组、又在相近时间接受访问的一位对照。[1] 这个匹配动作，才是整篇文章真正的引擎。

它为什么重要，放回当时语境就很清楚。20 世纪 40 年代末，肺癌暴增的公共讨论里塞满了松散嫌疑人。城市空气、柏油路面、煤烟、工业排放、汽车尾气，都在因果图景里。[1] 如果论文只是说肺癌病人里很多人吸烟，它不过是在嘈杂场里再多丢进一条印象。把对照匹配起来之后，问题才真正换了：并非“肺癌病人吸不吸烟”，而是“和可比的其他病人相比，他们吸得是否不同”。正是在这里，习惯开始变成暴露。

论文还有一个今天读来仍然很现代的地方，就是它对自身薄弱处的处理方式。各医院通知方式不同；有些合格患者在访谈前已经出院、病重或死亡；居住地并没有完全匹配。作者没有把这些地方藏起来，而是逐条写出，再讨论这些问题是否足以推翻结果。[1] 这一点很要紧，因为这篇论文留下来的，不只是结论，还有一种方法气质：偏倚并非要绕过去的障碍，而是要公开检验的对象。

2. 表格真正完成的工作，是把吸烟写成剂量模式

这篇论文里最常被引用的数字，的确值得一直被引用。在男性肺癌患者中，非吸烟者只占 0.3%；在男性非癌症对照组里，这个比例是 4.2%。[1] 这个差异已经很醒目，但它还并非论证真正最深的一层。更关键的是剂量。男性肺癌患者中，有 26.0% 落在最高两档消费组，也就是每天 25 支或以上；对照组里，同一档只占 13.5%。[1]

正是这一步，让整篇文章开始有了现代感。吸烟在这里已经并非一个“抽还是不抽”的道德性格标签，而是一条梯度。作者甚至进一步尝试，以大伦敦人口为参照，做出非常谨慎的相对风险估计。以非吸烟者作为基准，他们推得风险比会随着日吸烟量不断上升，依次来到 6、19、26、49、65，同时又明确提醒读者，这些并非最终人口风险，只是带着假设条件的比例估计。[1] 这种保留很重要，数字形状本身同样重要。到 1950 年，论文已经把剂量反应这件事相当清楚地写在纸面上。

也正是在这个层面上，这篇论文和宽泛的反烟议论分开了。它没有要求读者因为肺癌患者中很多人吸烟而受到情绪冲击；它要求读者看分布如何随着疾病状态改变。这是一种流行病学的观察习惯。吸烟一旦被排成剂量档，再放进对照比较里，争论就不再只停留在恶习、风尚和都市生活的层面，它开始进入表格。

3. 最容易被后人记错的，恰好是讨论部分的节奏

论文结尾的讨论值得慢一点读，因为最有力量的地方和最有分寸的地方刚好并排出现。Doll 与 Hill 说，这种关联是真实的；他们又说，从比较组来看，这种关联主要针对肺癌，而并非其他癌种或一般呼吸系统疾病。[1] 接着，他们停了一步，写下那句后来常被忽略的话：这“并不用然意味着吸烟导致肺癌”。随后作者才把几种替代解释逐一推开，并排除“疾病本身反过来造成吸烟习惯”的或许。[1]

这段文字并非虚弱的退让，而是在展示推断过程本身。论文已经强到足以排除若干容易的逃生路线，却仍然把“关联”与“因果”的差别留在读者眼前。直到这些路径走完之后，他们才写下真正有历史重量的那句判断：吸烟是肺癌发生中的一个因素，而且是一个重要因素。[1]

后来很多转述会把这一层压扁，要么写成一道雷霆般的终局宣判，要么写成一篇仍然模糊的旧文。更贴近原文的理解，是把它看成一条被控制得很稳的上升路径。先谈关联真实，再说关联具有特异性，再说反向因果说不通，再说跨越 20 到 50 年的共同原因设想并不合理，最后才把判断推到“重要因素”。也正因为这样，这篇论文后来没有显得轻率。它的谨慎，本来就是它力量的一部分。

4. 为什么 1950 年还并非整场裁决

如果 1950 年这篇论文孤零零停在那里，它依然会重要，只是重要的方式会不同。医院病例对照研究可以抓住极强的模式，却无法单独解决所有关于代表性、总体基线与长期风险的问题。也正因为这样，后续几步才会在这篇细读里显得格外关键。

1954 年那篇关于英国医生死亡率的初步报告，把证据方向改掉了：研究不再只回头比较患病者与对照，而是先记录医生的吸烟习惯，再往后看死亡结果。[2] 后来发表的 50 年观察论文，又把这种设计的耐久性完整写了出来：一篇短文里的疾病关联，最终长成横跨几十年的死亡率记录。[3] 到了 1964 年，美国外科医生总监委员会面对的已经不再是“这里是并非有一个值得注意的可疑关联”，而是“累积的流行病学证据是否已经跨过公共卫生因果判断门槛”。那份报告给出的回答是肯定的，并把问题推进到警示、监管与预防的制度语境里。[4]

沿着这条顺序回看 1950 年的论文，比较稳妥的理解就会浮出来。它最大的贡献，并非独力完成最终证明，而是搭出一套足够坚固的测量语法，使得后来的队列证据与制度审查能够在其上继续延伸，而并非另起炉灶。它教会了公共卫生系统如何用定量语言谈论吸烟。

为什么今天仍值得细读

Doll 与 Hill 这篇论文直到今天仍然有解释力，因为它展示了一件事：重大健康因果关系，往往在机制尚未完全闭合之前就开始变得可见，但前提是暴露已经被写成可以计数的对象。[1][3][4] 这篇文章读起来不像檄文，更像一台在压力中慢慢搭起来的统计装置：把对照匹配好，把偏倚质疑一条条检验，把习惯拆成剂量，再在维持边界感的同时，说出证据已经能够承受的判断。

真正的历史转折也正落在这里。吸烟在 1950 年变得重要，并非因为某篇论文突然让香烟显得更不道德，而是因为它第一次被写成可操作的暴露。后面的几十年会补上长期随访、政策机器和社会斗争；1950 年这篇论文补上的，是语法本身。

cronfeed.work