Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
OpenDocCN
data8-textbook-zh
提交
a0d61971
D
data8-textbook-zh
项目概览
OpenDocCN
/
data8-textbook-zh
9 个月 前同步成功
通知
0
Star
0
Fork
0
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
0
列表
看板
标记
里程碑
合并请求
0
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
D
data8-textbook-zh
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
0
Issue
0
列表
看板
标记
里程碑
合并请求
0
合并请求
0
Pages
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
提交
Issue看板
前往新版Gitcode,体验更适合开发者的 AI 搜索 >>
提交
a0d61971
编写于
1月 17, 2018
作者:
W
wizardforcel
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
ch2.
上级
88e69d08
变更
1
隐藏空白更改
内联
并排
Showing
1 changed file
with
42 addition
and
0 deletion
+42
-0
2.md
2.md
+42
-0
未找到文件。
2.md
浏览文件 @
a0d61971
...
...
@@ -52,3 +52,45 @@ Broad 街水泵的手柄的拆除已成为一个传奇。在亚特兰大的疾
如果结果不同,那就是表明关联的证据。但是为了确定因果关系,需要更加小心。
## 斯诺的“大实验”
斯诺为自己在 Soho 中学到的东西感到鼓舞,他对霍乱的死亡情况做了更彻底的分析。一段时间中,他一直在收集伦敦一个地区的数据,这里由两家水厂服务。Lambeth 水厂从污水排入泰晤士河的地方的上游抽水。它的水比较干净。但 Southwark and Vauxhall (S&V) 公司在污水排放的下游抽水,因此其供水受到污染。
下图显示了两家公司所服务的地区。斯诺专注于两个服务地区重叠的地方。
斯诺注意到,S&V 供应的人和 Lambeth 供应的人之间没有系统的差别。 “每家公司都供应富人和穷人,大房子和小房子,接受不同公司的供水的人的状况或职业并没有差别......接受两家公司供水的人或者房子都没什么区别,它们周围的物理状况也没什么区别...”
唯一的区别是供水方面,“一组供水含有伦敦的污水,其中有一些可能来自霍乱病人,另一组则不含。”
斯诺相信他能够得出一个清楚的结论,斯诺在下表中总结了他的数据。
| Supply Area | Number of houses | cholera deaths | deaths per 10,000 houses |
| --- | --- | --- |
| S&V | 40,046 | 1,263 | 315 |
| Lambeth | 26,107 | 98 | 37 |
| Rest of London | 256,423 | 1,422 | 59 |
数字在指责 S&V。 S&V 供应的房屋的霍乱死亡率几乎是 Lambeth 供应的房屋的十倍。
## 建立因果
用本节前面提出的语言,可以将 S&V 房屋中的人作为实验组,Lambeth 房屋中的人作为对照组。斯诺的分析中的一个关键因素是,除了实验组以外,两组相互比较。
为了确定供水是否引起霍乱,斯诺不得不比较两个彼此相似的群体,它们只有一方面不同:供水。只有这样,他才能够将其结果的差异归因于供水。如果这两个群体在其他方面有所不同,那么就很难把供水视为疾病的来源。例如,如果实验组由工厂工人组成,而对照组不是,那么两组之间的结果之间的差异可能是由于供水,工厂工作或两者兼有,或使两组彼此不同的其它因素。最后的图景会更加模糊。
斯诺的才智在于,确定可以使他的比较清晰的两组。他开始着手建立水污染和霍乱感染之间的因果关系,并且在很大程度上他成功了,尽管瘴气学说忽视甚至嘲笑他。当然,斯诺并不了解人类感染霍乱的详细机制。这个发现是在 1883 年,当时德国科学家罗伯特·科赫(Robert Koch)分离出霍乱弧菌,这种霍乱弧菌是进入人体小肠并引起霍乱的细菌。
事实上,霍乱弧菌在 1854 年由意大利的菲利波·帕齐尼(Filippo Pacini)发现,就在斯诺在伦敦分析他的数据的时候。由于意大利瘴气学说的统治,帕齐尼的发现并不为人所知。但到了十九世纪末,瘴气学说正在消失。随后的历史证明了帕齐尼和约翰·斯诺。斯诺的方法导致了流行病学领域的发展,它是疾病传播的研究。
### 混淆
现在让我们回到更现代化的时代,带着我们一路上学到的重要经验:
在一项观察性研究中,如果实验组和对照组在实验以外的方面有所不同,则很难对因果关系作出结论。
两组之间的根本区别(除了实验)被称为混淆因素,因为当你试图得出结论时,它可能会混淆你(也就是搞砸你)。
例如:咖啡和肺癌。二十世纪六十年代的研究表明,喝咖啡的人患肺癌的比率高于不喝咖啡的人。因此,有些人认为咖啡是肺癌的一个原因。但咖啡不会导致肺癌。分析包含一个混淆因素 - 吸烟。在那些日子里,喝咖啡的人也可能是吸烟者,吸烟确实会导致肺癌。喝咖啡与肺癌有关,但不会导致疾病。
混淆因素在观察性研究中很常见。良好的研究需要非常小心,以减少混淆。
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录