跳转至

Vol.138 如何用 DNA 追捕真凶

这是甘肃省白银市。1988 年到 2002 年间,9 名女性曾被残忍地杀害,一名 8 岁的女童甚至被勒死。这些凶案散落在白银的各个角落,为这座处于下岗潮中的西部小城带来了更大的恐慌。

Vol/Vol.138 如何用 DNA 追捕真凶/1.jpeg

警察在现场搜集到了许多证据,指纹、鞋印、手印一应俱全。然而在比对了 23 万枚当地男子的指纹后,警察依然无法确定凶手的身份。阴影始终盘旋在他的四周,未能散开。

Vol/Vol.138 如何用 DNA 追捕真凶/2.jpeg

A、T、C、G,这四个简单的英文字母,代表了碱基。它们连接成碱基对,无间隔排列组成了 DNA 序列——一条双螺旋长链。

每个人细胞中携带的 31.6 亿个碱基对,99.9% 都是一样的。剩下 0.1% 的差异,就是让 DNA 成为身份证明的关键。

Vol/Vol.138 如何用 DNA 追捕真凶/3.gif

那么,有没有一种办法让我们可以以小窥大,从局部差异推出整体呢? 有。在人体的 DNA 序列中,不少地方都会发生碱基对的重复排列。2\~6 个碱基对组成核心序列,比如 TCAT,然后重复若干次形成串联重复序列。这种现象被称为 STR,短串联重复。

Vol/Vol.138 如何用 DNA 追捕真凶/4.jpeg

DNA 序列上出现短串联重复的位置被称为 STR 基因座,又叫位点。在人类的 DNA 序列中,每隔 6000\~10000 个碱基对就会出现一个 STR 位点。

这是部分 STR 位点在常染色体上的分布。以 2 号染色体上 TPOX 位点为例:所有人在这里都会重复地出现碱基 AATG,但重复次数可能存在不同。

Vol/Vol.138 如何用 DNA 追捕真凶/5.jpeg

在随机抽取的 1000 个人中,只有 323 个人会在这里重复 8 次和 11 次。而当我们再引入四个位点和相应的重复次数时,1000 个人里同时满足这五个条件的只剩下 1 个。

Vol/Vol.138 如何用 DNA 追捕真凶/6.gif

当比对达到 15 个位点时,满足这些条件的概率就只有 0. 000 000 000 000 000 002,足以让它成为法庭科学上的可靠证据来源。

Vol/Vol.138 如何用 DNA 追捕真凶/7.jpeg

也就是说,如果我们在不同凶案现场收集到的 DNA 信息 STR 位点重复情况一致,说明它们只可能属于一个人。

基于这些检验结果,这起发生在包头的命案和其他 10 起案件一起,在 2004 年被公安部串并列入「甘蒙 8•05 系列强奸杀人残害女性案」。

Vol/Vol.138 如何用 DNA 追捕真凶/8.jpeg

笼罩在凶手四周的阴影正在被逐渐揭开。但他到底是谁?他现在又在哪里?

这是男性的生殖细胞,精子。它的细胞核里有 23 条这样的染色体。其中 22 条是常染色体,1 条为性染色体。

Vol/Vol.138 如何用 DNA 追捕真凶/9.gif

作为男性特有的性染色体,Y 染色体严格遵循着同一父系遗传规律。是这个家族男性后代共享的身份识别标记。这种通过比对 Y 染色体 STR 特征进行个体识别的做法,被称为 Y-STR。

Vol/Vol.138 如何用 DNA 追捕真凶/10.jpeg

这一原理给白银案带来了新的突破。

2015 年下半年,一位名叫高某明的男子因行贿犯罪被采集血样。当技术人员检验他的血样时,发现其 Y 染色体 27 个位点上的 STR 情况和白银案凶手完全一致。也就是说,凶手很可能就是这位高某明的族亲。

Vol/Vol.138 如何用 DNA 追捕真凶/11.jpeg

为此,警察开始从高某明的 DNA 信息出发,找到了甘肃省兰州市青城镇高氏家族,利用家谱、人员信息调查等手段,取得了高某芝后人的名单。通过调查该辈各个男性后代的行动轨迹,警察最终确定重大嫌疑人,52 岁的高承勇。

最后,警察提取了高承勇的 DNA 信息。经 STR 比对,发现与当年遗留在案发现场的 DNA 信息完全一致。

Vol/Vol.138 如何用 DNA 追捕真凶/12.jpeg

而这份 DNA 信息,会连带凶手的户籍信息,进入公安部数据库。中国从 1998 年起就已开始探索建立区域性的 DNA 数据库,并在 2003 年正式启动建设全国 DNA 数据库,库容量突破 8000 万并不断增加中。

Vol/Vol.138 如何用 DNA 追捕真凶/13.jpeg

警察只需要将凶案现场遗留下的 DNA 信息放入数据库,就有很大概率得知凶手的具体情况。

但是,如果这位名叫高某明的男子没有出现呢?或者,如果这名凶手是一位没有 Y 染色体的女性呢?

面对这样的难题,警察同样有自己的办法:法医系谱刻画。

Vol/Vol.138 如何用 DNA 追捕真凶/14.jpeg

我们知道,人类常染色体上的基因,在遗传过程中都会进行分离和重组。父亲染色体中的一段基因,到了儿子身上可能只剩下三分之一,而孙子可能就只继承了十分之一。这些由血亲所共享的基因片段,被称为同源片段(identity-by-descent, IBD)。

Vol/Vol.138 如何用 DNA 追捕真凶/15.jpeg

两个人共享的同源片段长度越长,说明两者之间的亲缘关系越近。和你共享 IBD 长度最长的人,就是你的父母和孩子。第二长的人就是你的亲生兄弟姐妹。以此类推,IBD 越短,和你的血缘关系也就越远。

Vol/Vol.138 如何用 DNA 追捕真凶/16.jpeg

现在,我们就可以将你的 DNA 信息导入数据库,然后找到和你共享 IBD 最长的 10 个人,然后根据长度信息构建家谱。

当然,这只是理想情况。由于目前的数据库包含的数据量还很小,因此只能返回凶手的个别亲属信息。

Vol/Vol.138 如何用 DNA 追捕真凶/17.gif

以美国金州杀人案为例,警方先是将犯罪现场提取到的 DNA 放入到数据库中,结果根据 IBD 长度信息,找到了凶手三代表亲。

在找到了这名表亲后,警察就能逆向寻找到和凶手共享的高祖父母,并根据出生、婚姻、死亡记录,建立 25 个可能的家庭谱系,确定 9 名嫌疑人,而 Joseph James DeAngelo 就在其中。

Vol/Vol.138 如何用 DNA 追捕真凶/18.jpeg

2020 年 8 月 21 日,他被判处终身监禁。而高承勇早在 2019 年 1 月就已被执行死刑。

从白银杀手到金州杀手,DNA 刑侦技术帮我们破解了无数跨越数十年的悬案。在茫茫人海当中,案件的真凶不论深藏在哪些隐秘的角落,犯罪现场的 DNA 都会找到你、抓住你。

Vol/Vol.138 如何用 DNA 追捕真凶/19.jpeg


  1. 张振华. (2019). 白银案实录. 

  2. 刘雁军. (2020). 法庭科学DNA数据库的运用与规制. 

  3. 侯一平. (2001). 法医常染色体STR分型. 

  4. 刘京, 季安全, & 王桂强, 等. (2019). 法医系谱分析研究进展. 

  5. Ellen, M G. Cece, M. Steven, L A. (2019). Genetic genealogy for cold case and active investigations. 

  6. Erlich, Y. Shor, T. & Carmi, S. (2018). Identity inference of genomic data using long-range familial searches.