研究成果

 

全自动法医DNA数据库建设

 

1985 年英国遗传学家 Jeff reys 首次应用DNA指纹技术鉴定一宗移民纠纷案。  同年PCR 技术创立,从此揭开了DNA 分析技术迅猛发展的序幕。随PCR 衍生的各类新技术及新DNA 遗传标记的不断发现,使DNA 分析技术不断更新,一些微量、腐败甚至是污染的检材,都能做到快速的同一认定,现场生物物证的利用率大大提高,成为认定犯罪的有力武器。法庭科学DNA 数据库把DNA 的高度个体特异性与计算机信息分析的高效性完美地结合在一起,极大地拓展了排查范围,节省了办案资源,提高了工作效率,充分地显示了DNA 的技术效力,体现了高科技破案的强大优势,成为继20 世纪应用指纹技术以来的最大突破

1 法医DNA数据库(DNA database)的概念
法医DNA 数据库系统,狭义的说就是利用STR-PCR 等各种DNA 分析技术的高效性与计算机技术的高储存性、高效检索性及自动化技术的有机结合,将在犯罪现场收集的生物检材(人体组织、血斑、精斑、唾液斑、毛发、骨骼等) 及涉案相关人(受害人、犯罪嫌疑人等) 的血斑或唾液斑,经DNA 提取、纯化和定量,再经STR基因座复合扩增、DNA 自动分型检测后,得到数字化的DNA 分型结果,通过网络将数据导入具有统计、比对功能数据库系统的计算机中,完成库中DNA 分型数据自动比对,依据它们的DNA 分型匹配与否,得出认定或排除结论的数据库系统。而广义的法庭科学DNA 数据库系统,应是囊括上述功能及该检验技术标准化质量控制体系、非日常接检刑事案件的生物检材(包括前科人员、失踪人员、亲子鉴定人员等血样)DNA 分析数据的处理系统、网络化管理系统等一系列结构复杂、耗资巨大的技术系统。

2 法医DNA数据库的组成 
法医DNA数据库由刑事犯罪人员DNA数据库(简称前科库)、刑事案件现场DNA数据库(简称现场库)失踪人员DNA数据库(简称失踪人员库)和基础DNA数据库组成。

2.1 前科库(convicted offender DNA database)
就是应用DNA分型技术和计算机的储存、检索功能,将一些刑事罪犯的血样,经过DNA分型,结果简化为数据,与其他档案一起储存入计算机,供刑事侦查需要时进行查阅对照,从而起到排除犯罪嫌疑人或认定罪犯的作用。

2.2 现场库(forensic casework sample DNA database)
就是应用DNA分型技术和计算机的储存、检索功能,将罪犯遗留在现场的物证,经过DNA分型,结果简化为数据,储存入计算机,供刑事侦查需要时进行查阅对照,从而起到串并案件或排除犯罪嫌疑人或认定罪犯的作用。

2.3 失踪人员库(missing people DNA database)
就是应用DNA分型技术和计算机的储存、检索功能,将失踪人员父母的血样以及怀疑为失踪人员(包括被拐卖儿童和无名尸体)的血样,经过DNA分型,结果简化为数据,储存入计算机,供刑事侦查需要时进行查阅对照,从而起到认定身源的作用。

2.4  基础DNA数据库(basic DNA database)
主要储存各基因座的染色体定位、有关群体的基因频率资料和基因型资料、有关法医学应用参数如杂合度(heterozygosity,H)、非父排除率(excluding probability of paternity,EPP)、个人识别率(probability of discrimination,Dp)、多态信息含量(polymorphism information contents,PIC)等。

3 法医DNA数据库的结构和职责

3.1 国家法医DNA数据库三级结构形式
分别为中央库、省级库和市级库。

3.2  职责
3.2.1 中央DNA数据库 a)接纳和管理省级DNA数据库输入的DNA分型数据及信息代码;b)接受各省级公安机关人工或自动查询比对,市级公安机关人工查询比对;c)中央机关所承办的案件作为一个独立单位,按相关标准要求将DNA分型数据和信息代码输入中央DNA数据库。

3.2.2  省级DNA数据库a)接纳和管理市级DNA数据库输入的DNA分型数据及信息代码;b)定期把本省DNA数据库的DNA分型及信息代码传给中央DNA数据库;c)接受全国各地公安机关的查询比对;d)按GA/T383-2002中的技术方法收集本地违法犯罪人员的DNA分型数据,以及未破案件现场生物物证的DNA分型数据,并输入省级DNA数据库。

3.2.3  市级DNA数据库a)定期把市级库的DNA分型数据及信息代码传送给省级DNA数据库.b) 按GA/T383-2002中的技术方法收集本地违法犯罪人员的DNA分型数据,以及未破案件现场生物物证的DNA分型数据,并输入市级DNA数据库[3]

4  法医DNA数据库的功能

4.1 查询犯罪嫌疑人
将现场的生物物物证DNA分型数据与前科库里的DNA分型数据进行比较,查出某案件的犯罪嫌疑人。将现场物证DNA分型数据与人员库中的数据进行查询比对,如果人员库新增数据与现场物证库存储数据匹配(正查),可以提示该库存案件为此人所为。如果现场物证库新增数据与人员库存储数据匹配(倒查),可以提示该新发案件为该前科人员所为。再通过复核检验进一步确定比对结果。实现案件在尚没有确切嫌疑人的情况下,利用数据库快速查破案件[4]

4.2 串并案件
将现场生物物证DNA分型数据与物证库中数据进行库内比对,如果发现匹配样品提示相关案件可以串案调查。1999年至2001年北京某地连续发生多起强奸案,对现场精斑进行检验后,录入数据库发现DNA分型结果相同,为同一犯罪嫌疑人所为,遂将案件串并侦查。期间入库比对了10多名犯罪嫌疑人血样,结果均被排除。2001年末,该地送检一起盗窃未遂案嫌疑人的血样,DNA分型后常规入库比对,发现他的分型与精斑结果完全相同。以此为突破口,该犯交代了作案70多起的犯罪事实[5]

4.3 查询失踪人员
    将失踪人员(无名尸或丢失的孩子)的DNA分型数据或失踪人员家属(父母或配偶及子女)的DNA分型数据与失踪人员库里的进行比对,根据遗传定律及DNA分型结果进行亲缘关系概率计算,可为无名尸找到尸源,为丢失的孩子找到父母,或为父母找到丢失的孩子。

5  法医DNA数据库的建设情况
5.1 国外DNA数据库的建设情况
1994年英国正式立法授权英国法庭科学服务部(FSS) 建立全英DNA数据库。1995年,全球第一个国家DNA数据库在英国建立起来。随后,在美国的部分州、加拿大、澳大利亚、少数欧洲、亚洲、非洲国家也开始本国DNA 数据库的建设。1997 年加拿大众院通过立法授权加拿大皇家骑警建立DNA 数据库。奥地利、荷兰也于1997年开始建库。法国、葡萄牙、芬兰、挪威则在1998 年开始DNA 数据库建设。在亚洲,中国香港特别行政区于1999 年通过立法启动数据库建设。在非洲,南非在数据库建设方面也取得一定的进展。2002 年在法国由国际刑警组织召开的国际DNA 工作组研讨会上,提出建立国际DNA 数据库,提高DNA 信息资源利用率的建议[6]。截止2003年7月,英国DNA数据库中存有人员样本170多万,现场检材样本15万多,现场检材的比中率达40%(与其他现场或人员匹配),人员库的比中率达8%,平均每周破案千余起。美国的DNA数据库联合检索系统(CODIS)截止2003年4月存有人员样本1321854个,现场检材样本54895 个,比中案件778个[7]

5.2  国内法医DNA数据库建设情况
5.2.1 建立法医DNA数据库的重要性和必要性  我国目前使用的DNA 检验技术只是被动的检验手段,技术人员只能在实验室等待侦查人员送检,然后将现场检材与嫌疑人样品加以比对认定罪犯。建立DNA 数据库,可以主动查找罪犯,从而充分发挥技术破案能动性,为案件侦破提供线索,主动破案,有效地节约资源。流动人口的流窜作案以及有前科的犯罪分子的重复作案更是增加了破案难度,而且使公安机关疲于奔命。建立国家DNA 数据库,从技术上克服了侦查破案的地区局限性,通过DNA 数据库网络,将跨地区犯罪的案件联系起来,有利于串并案件、缩小侦查范围,从而尽快破案,防止对其他受害者的进一步伤害,也可以有力打击流窜犯罪。

5.2.2 建立法医DNA数据库具有可行性  近几年来,我国DNA 检验技术飞速发展,几乎所有的省份都有DNA 实验室,都能进行DNA 检验。全国公安系统的DNA实验室内都存有许多现场检材的DNA 分型数据,具有建立DNA 数据库的现成物质条件。上海、北京、辽宁、广东等地都投入巨资小范围地建立了本地区法医DNA 数据库,并在案件侦破上发挥了一定作用。公安部物证鉴定中心建立的综合型DNA 数据库已通过公安专网与许多省市联网,形成中心库—省级库—市级库数据库模式,实现了国内异地查询。在2000 年全国“打拐”专项斗争中首战告捷,并在许多系列、恶性案件的侦破中发挥了重要作用。我国DNA 数据库的探索和实践表明了建立国家法医DNA 数据库具有可行性。

国家公安部于2002 年7 月颁布了《法庭科学DNA 实验室检验规范》及《法庭科学DNA 实验室规范》,2003 年修订了《法庭科学DNA 数据库现场生物样品和被采样人信息项及其数据结构》、《法庭科学DNA 数据库选用基因座及其数据结构》等行业标准,使各地DNA 数据库的建立有章可循。

国际刑警组织为了对各成员国的DNA 检验工作提供技术支持,促进DNA 技术的广泛应用,还专门设立了DNA 专家工作组,包括中国专家在内的专家组负责推荐DNA 采样和证据收集、DNA 数据库、质量控制、DNA技术培训等方面的指导原则[8]。这些国际技术交流和合作无疑为建设中的我国法庭科学DNA 数据库提供了很好的指导,我国的DNA 数据库的建设可以借鉴各国成功的经验,避免走弯路。

6  法医DNA数据库的应用
DNA数据库建设规模不断扩大,方法日益成熟,其所发挥的巨大作用也在国际范围内得到广泛的认可和关注。如英国有6000 万人口,平均年发案约为6715 万起。目前,英国分别在伯明翰、韦斯比和伦敦设立实验室进行全英DNA 数据库建设,目前数据库中存有人员数据150万条、现场物证13 万条。利用这些数据,不论是串并案件或直接认定犯罪的数量都呈逐年递增的趋势(见表1) 。
表1  英国DNA 数据库历年串并案件及认定罪犯数据

 

年度

现场检材
间匹配数

较前年度
上升比例(倍)

嫌疑人与现场
检材匹配数

较前年度
上升比例(倍)

1996

348

 

46

 

1997

976

2.8

2531

55.0

1998

3357

3.4

16673

6.6

1999

5244

1.6

23235

1.4

2000

10400

1.98

70400

3.0

2001

15000

1.4

160000

2.3

 
  国内目前在DNA 数据库建设也取得长足的进展,数据库建设规模不断扩大,相关规范、标准日益完备,并在实际应用中发挥巨大的作用。例如轰动全国的沈阳“1、18”、“1、10”系列爆炸持枪抢劫运钞车案并案,并最终侦破;有些异地作案、手段不同甚至在当地办案机关不知情的情况下通过数据库比对实现串案乃至直接认定罪犯。如沈阳、铁岭两市的9起系列强奸、杀人案件的串并;鞍山、营口两地4 起历时5 年的系列强奸杀人案件的串并。有些是案件侦查中没有明确线索,但经过DNA 数据库比对,在前科人员库中认定罪犯,从而破获案件[6]

7   建设法医DNA数据库的重要问题
建立国家DNA数据库是一项浩大的工程,需要一定时间并且需要法庭、DNA实验室、法律界、政府、立法者之间的全面合作。数据库在建立和使用前必须具备许多前提条件。例如:参与建库的各个地区使用共同的DNA标记和标准,使进入数据库的结果能够比较;标准化的软件,使实验室之间能交换数据;质量保证体系,使大家能彼此信任实验结果[9]。对于DNA数据库建设来说有很多重要的问题值得探讨。

7.1  DNA数据库的质量保证体系
在DNA数据库建设过程中质量保证是至关重要的。建库过程中面临大量的样本,这就意味着对数据库中单个资料进行纠错几乎是不可能的,因而对所有即将进入数据库的数据资料都要求非常精确。如果输入到DNA数据库的DNA 图谱不准确,那它就无从获得有意义的匹配。这就要求实验室严格根据质量控制指南进行操作,实验室的操作程序要提交审核,那么输入数据库中资料的质量才有可能得到保证。同时,确定共同的有较好基因频率分布的STR 遗传标记,确立明确的检验标准, 加强技术支持、监督与管理,对于数据库的质量保证更是必不可少的。仪器、试剂、人员更是质量保证标准的基础。DNA 数据库专家委员会要定期考核、保证检验的质量。要强化实验室的规范管理,要求实验室严格根据质量控制指南进行操作,这是不同实验室之间资源共享的前提。各地新装备或新改进DNA 鉴定实验室时,要有前瞻性,充分考虑建立DNA 数据库的需要,并选择合理的仪器设备,不要忽视中国的国情而盲目追求新仪器、新设备。各地的DNA 数据只有在统一的规范下消除壁垒,才能实现真正共享,DNA 技术的价值才能得到充分的利用。

7.2  保密问题
由于DNA 检验的是人体生物检材,涉及敏感的隐私权,而且DNA 包含了人类的全部遗传信息,DNA 检验所揭示的个体遗传特征可能会导致择业、保险限制甚至歧视等问题,涉及到复杂的法律、道德、人权等方面,因此即使是以侦查为目的建立法庭科学DNA 数据库,其提取的检材也必须具有合法性,存储的DNA 信息的保密问题也不能忽视。在这些方面,我们也可借鉴英美等国的经验:1995 年4月《样本提取条例》成为大英法律,标志着DNA 数据库建立的开始,英国的《刑事审判与公共秩序法》中规定了如下三类建库对象:夜间盗窃者、性犯罪者以及暴力犯罪者,但若有侦查意义,警察也可提送其他有记录违法者的样本[10]。但规定警察在提取个体的样本时需区分个人隐私样和非个人隐私样。并规定当某人被判有罪,或根据治安法被拘留,或在案件侦查和审判过程中属于一个有密切联系的嫌疑群体而其中一人或多人被判有罪或拘留时,该人的DNA分型数据将被放入国家DNA 数据库中,当相关嫌疑人被发现与案件无关,或该人已死亡,或取样目的仅为澄清事实而无人被判有罪时,该DNA 分型数据将被取消。美国FBI 的DNA 数据库中只有索引编号和DNA 信息数据,没有人员姓名、住址、种族和案情等情况,详细情况存在州实验室,当认定同一才能进一步提供详细情况[11]。而我国目前DNA 数据库中存储的是人员的自然信息和DNA 数据,数据资料的保密性问题可能引起法律纠纷。这些可能引起争议的问题也是法律界、立法者必须考虑的。
7.3  查找和匹配的运算

随着DNA数据库规模的不断增大,它作为智能工具的价值也越来越大,但同时带来了查找速度的问题。此外,因为各个生产商提供的STR试剂盒针对同一基因位点的PCR引物设计可能不同,所以会出现用这个引物扩增出现无效等位基因,而换另外一种引物则结果正常的情况,这样会导致由于使用不同的试剂盒得到的结果表面上不一致的现象。采用宽松的查找运算模式可解决这一问题。例如,美国CODIS系统搜索13个STR位点26个可能的等位基因时的运算法则和匹配尺度适当放松,26 个等位基因中25个一致就符合匹配要求。
实验室的检测能力不同,尤其是它们探测微突变OFF-LADDER等位基因能力参差不齐,在一个实验室中得到TH01位点为8.3的等位基因可与其它实验室的8.x和等位基因9匹配上,搜索运算法则上应考虑到类似问题。

7.4  建立国家法庭科学DNA 数据库,还要加强计算机网络管理。
DNA 数据库软件是关系建库成功与否和保证数据库稳定和发挥作用的决定性因素之一。这一点上,我国自行编制的国内DNA 数据库软件并不逊色于国外软件,但也需要根据实际情况不断地完善。另外,实现远程破案是我国公安科技发展到现阶段所面临的一个新课题,当前全国各地都已规模或大或小地建立了DNA 数据库,但要做到各地数据库资源的完全共享仍存在一定难度,这与计算机网络管理尚不完善有一定关系。因此,应当加强公安通讯专网建设和数据库软件开发,完善网络布局、数据传输及查询方法。

7.5   技术更新
DNA 技术的发展日新月异,DNA数据库也必须保持更新能力,成为动态的、宽容的系统,才能始终保持活力[12]。在提高建库效率方面,关键在于提高自动化程度,更新技术。DNA 芯片能同时处理分析大量DNA片段,其综合效率是目前的常规技术所无法比拟的,利用DNA芯片检测基因组中丰度更高的遗传标记系统———单核苷酸多态性(SNP)目前也逐渐为法医学界所青睐。以法医学应用为目的SNP芯片正在研发之中。除了高通量、高效率等方面的优势之外,更有意义的是SNP可对极度降解的DNA 进行检验,使目前无法检验的检材得到成功利用,因此在未来的DNA数据库中有望存储SNP多态性信息。新技术的另一发展方向是建立起可鉴别个体外观特征的标记系统,如鉴定皮肤颜色、毛发颜色、身高、体重等遗传标记系统,这些标记系统可能是基于点突变或缺失,更适合于自动化分析。在未来的DNA数据库中存储此类鉴识个体外观特征的遗传标记信息,将能更有效地指导侦察方向。

法医DNA数据库顺应了公安工作向智能化、网络化、自动化发展的趋势。随着DNA分析技术的发展,从人体生物检材可以获得越来越多的个体信息,国家法医科学DNA数据库必须保持更新能力,使不断开发的新技术能服务于DNA数据库,才能始终保持活力,成为长盛不衰的强有力的破案工具。DNA数据库也应与其它分析技术相结合以拓展其应用空间。此外,国际DNA技术的合作,还可以使DNA数据库的发展和应用空间更加广阔,使之更有效地打击犯罪、服务社会。