犯罪可以预测吗


在美国孟菲斯市街头,我和巡警约瑟夫·坎宁安(Joseph Cunningham)正在搜寻犯罪分子。我们要搜寻的不仅仅是街头恶棍,还有那些入室盗窃的人。当然,我们不必搜遍所有地方:尽管孟菲斯市幅员800多平方千米,但我们要搜寻的仅仅是几个方形街区,这里主要是一些低矮的砖式公寓建筑,是这座城市犯罪最猖獗的地区。搜索时间也有严格限制——周四,下午4点到晚上10点。现在,搜索工作开始了。“今晚我估计不用飙着车去追捕谁,不过真要那样,你可记得系好安全带,”坎宁安说。

我和坎宁安驾驶着编号为6540的巡逻车来到了他在报告中标注的那片区域,开始四处搜寻那些潜在的盗窃分子。坎宁安说,“我会留意那些看起来似乎漫无目的、四处游荡的人,”还有一位犯罪嫌疑人也需特别注意:近期,这个片区发生了多起盗窃案,一个名叫德文(Devin)的人,可能就是幕后指使。坎宁安一边说着,一边把德文的照片从汽车仪表盘的触摸屏上调了出来。

我们驾驶着巡逻车,慢慢地进入了一座建筑的停车场。一名过路的男子注意到了我们,他匆忙地闪入了一个院子。坎宁安一脚踩下油门,我们的车绕过这个复杂建筑,嘎的一声停下来,恰好在这一侧的出口,把那名男子拦住了。坎宁安跳下车,快速跑向该男子。“站住!”他喊道。

任何一名优秀警察都很清楚,在他分管的辖区内,哪些地方最容易发生犯罪事件,最容易逮到罪犯。但今晚不同,坎宁安除了自身的街头经验,还有一帮社会学家、研究人员、数学家以及满满一房间的计算机在为他提供犯罪预报。这个项目叫做“蓝色粉碎”(Blue CRUSH,来自Crime Reduction Utilizing Statistical History的缩写),启动于2006年,由孟菲斯警察局(Memphis Police Department,MPD)与孟菲斯大学(University of Memphis)合作进行。现在,孟菲斯的重大财产和暴力犯罪发生率下降了26%,其中车内盗窃、抢劫、谋杀的发生率更是降低了40%。对于这一成果,人们普遍认为“蓝色粉碎”功不可没。在警务工作中应用数字化工具早已不是新鲜事——上世纪90年代中期,纽约市警察局就已经开始广泛开展“电脑数据统计”项目(Comp-Stat program),不断更新犯罪高发地区的地图,并提供给警员。然而,在过去几年里,所谓的“预测警务”越来越先进。那些最有雄心的犯罪学家不再满足于分析一些过往数据——他们试图预测未来。今天,“预测警务”已成为执法领域最热门的话题之一,在美国和欧洲,十多个实验正在进行之中。但是,此类前瞻性方法最让人头疼的是,没人能确定它们是否真的管用。犯罪事件通常有多个诱因,错综复杂,你很难弄清楚在降低犯罪率上,哪种策略的效果最好。因此,犯罪学家只好将“预测警务”所产生的效果,与其他能降低犯罪率的大量因素(如人口老龄化)区分开来。有一点是所有专家都承认的——警察的工作确实取得了一些成效,美国目前的犯罪率是40年来的最低点。

当坎宁安拿着那名男子的驾照,回到车上时,我发现驾照上的照片和触摸屏上德文的某张照片几乎一模一样,但姓名不叫德文——也就是说,坎宁安认错人了——所以,坎宁安只好下车,放走了那名男子。“今天算他走运,”坎宁安说。

预测犯罪地点

“预测警务”,听起来就像是菲利普·K·迪克(Philip K.Dick)构想的那些未来世界才有的词汇。在1956年写就的短篇科幻小说《少数派报告》[The Minority Report,这本小说后来被史蒂文·斯皮尔伯格(Steven Spielberg)搬上了电影银幕]中,迪克确实给我们描述了这样一个未来世界:在罪犯实施犯罪之前,警察就能提前将他们阻截。只是,在现实生活中,这种预测不是依赖于坐在黑屋子里的变种人的幻觉,而是基于犯罪分析与计算机软件。而且,现实的预测也不会告诉你谁最有可能实施犯罪,而是对犯罪事件所有相关情况作出最好的推测:犯罪类型是什么,这种犯罪会在何时何地发生。“有些人说,你们不可能预测出未来会发生什么,”孟菲斯警察局的犯罪分析主管约翰·威廉姆斯(John Williams)说,“我们的回答是,‘一切皆有可能’”。

尽管有人认为这是反面乌托邦(Dystopian),但实际上,这只是预测分析领域的一个引人瞩目的实例而已。这种技术在今天已经稀松平常,而不像是上世纪五六十年代,只能存在于人们想象中的喷气背包或者火箭车。

亚马逊商城在向你推荐图书时,用到了“偏好推测算法”,换句话说,这就是预测分析。发放信用卡的公司也会用预测类程序来找出忠诚度不高的客户,并为他们提供更多优惠,以防他们投入别家公司的门下,而蓝十字公司(Blue Cross)则希望,能预测个人投保人在未来数年内都需要哪些医疗服务。

从传统上说,人类一直依靠知识和直觉来预测未来。人的确也很擅长这类直觉预测,马尔科姆·格拉德威尔(Malcolm Gladwell)在他2007年出版的畅销书《眨眼之间》(Blink)中如此写道。但是,预测分析学的倡导者认为,我们如今每天都在通过相机、电脑、手机产生各种信息,数量之多,已达到不可思议的程度。“商业机构和政府部门的数据量早已超过了兆(MB)或者吉(GB,1GB=1000MB)的量级,现在需要TB(1TB=1000GB)甚至PB(1PB=1000TB)才能存储,”伊恩·艾尔斯(Ian Ayres)在他2008年出版的《超级数字天才》(Super Crunchers)中写道。这是一部颇有影响力的分析学书籍,书中提出的假说与《眨眼之间》的观点恰恰相反:我们正航行在信息的海洋中,这片海洋之大,单靠智力,我们根本找不到方向。

在警务工作中,每一个求助电话,每一次停车检查,每一番街头问询和抓捕,都会产生大量数据,要从中厘清犯罪线索,无疑会让分析人员焦头烂额——如果能从一大堆信息碎片中,直接把有价值的线索挖掘出来,该有多好。长期以来,调查人员要分析数据,寻找有用信息时,都得从档案柜中翻出满是灰尘的陈旧档案,一页一页地查阅,或者直接通过感觉来判断,哪些事可能正在发生。“电脑数据统计”项目开展以后,为警务工作引入了一种常规的、半自动数据分析方法,自从这一技术应用以后,发生变化的不仅仅有记录下的信息数量,还有因计算机辅助分析带来的快捷。“以前,我们都是每年看一次犯罪统计,然后说,‘喔,你看都发生了什么’,”洛杉矶警察局负责分析工作的肖恩·马里诺斯基(Sean Malinowski)队长说:“现在,我们每个月、每周、每天都在看,甚至实时查看统计。”

犯罪活动实时监测中心(Real Time Crime Center)是孟菲斯“预测警务”的“司令部”,这个对于打击犯罪来说有点时尚的新事物,就藏在该市市中心那座不起眼的警察局大楼的四楼。威廉姆斯带着我从里面走过,十多名分析员分成几排坐着,时不时地敲击着电脑键盘。投影屏幕上显示着用图标标记过的城市地图,这些标记点都安装有监控摄像头,能实时传回图像。一个屏幕的上方出现了一个滚动新闻条,内容是最新上报的案件,比如“机动车盗窃,中午12时30分46秒”。

在会议室,威廉姆斯把W·理查德·詹尼柯斯基(W.Richard Janikowski)介绍给我,詹尼柯斯基是孟菲斯大学的一位犯罪学家,同时也是“蓝色粉碎”项目最早的发起者之一。当警方向他寻求帮助,希望能够降低城市里的性侵犯率(在过去20年里,性侵犯在美国的各种犯罪排行中不是第一就是第二)时,“蓝色粉碎”的种子就在各地播种开来。詹尼柯斯基召集了受害者进行集体讨论,并亲自前往案发地进行调查。但是,最重要的信息还是大量来自警方的报告数据——案发时间、地点、侵犯过程描述,这些数据大概来自5000起性侵犯案件。分析显示,许多受害者都是在相似的情况下遭到性侵犯的:当她们在晚上离开家,使用便利店附近的投币电话亭的时候。于是,警方告诉便利店老板,让他们把投币电话移至室内。果然不出所料,孟菲斯的性侵犯案件数量迅速下降了。

实际上,这还只是“预测警务”的1.0版本。利用分析软件,对最近发生的事件进行分析,詹尼柯斯基和合作伙伴准确推测出了类似案件将在近期再度发生。从那以后,预测技术越来越强大,警方可以从几十万条记录中挖掘出犯罪模式,数据处理量比以前大得多。这就好比从吵闹的环境中找出一条有用的声音信息,这是人工方式难以实现的。

预测方法也开始变得越来越复杂。未来不会总是过去的重复,所以犯罪学家必须识别出个体因素,并从个体到整体分析这些因素的影响。P·杰弗里·布兰廷汉姆(P.Jeffrey Brantingham)是美国加利福尼亚大学洛杉矶分校的“预测警务”专家,在他看来,“预测警务”要解决的最根本的问题是:“如果我们获悉今天发生的一系列犯罪的情况,我们能够打造一种数学模型,并以概率的方式,预测出明天的犯罪情况吗?”

因此,里士满(美国弗吉尼亚州首府)现在采取的措施,大概可以看做“预测警务”的2.0版本。和孟菲斯一样,里士满也用到了分析软件(由IBM开发)。警察局的计算机一周7天、一天24小时不间断地分析每一个案件。犯罪地点的街道名称及周边事物,例如自动取款机、公园、酒吧等都属于分析对象。此外,当地主要企业[例如菲利普·莫里斯公司(Phillip Morris,一家大型综合类跨国公司)]发放薪酬的日子,还有当地音乐会、体育比赛的时间表也都被输入这些计算机中。所有的一切,从枪击的时间选择到天气,再到月亮的阴晴圆缺,都会被看作是潜在的重要信息。

要评估所有这些因素如何影响未来的犯罪,需要人与机器通力合作,都把绝活拿出来。计算机更擅长标记出统计学趋势,但人类警察仍然需要对这些趋势进行解释,孟菲斯警察局的豪威尔·斯塔恩斯中校(Lt.Col.Howell Starnes)说。“如果没有熟悉辖区的警员的协助,你永远弄不清出到底是什么因素引起了犯罪,”斯塔恩斯说:“这一点是你必须注意的。你不仅要知道问题是什么,还得知道是什么引起了这些问题。”

“预测警务”的过程往往始于警察的经验判断,比如在发工资那天,自动取款机附近就特别容易发生抢劫案。计算机分析可以确定这些经验是否正确,还可以对它们进行补充完善。例如,计算机也许会分析出,在发工资那天,在哪些自动取款机附近,抢劫案的发生概率将会达到最高,因此警员应该优先考虑在那些地方巡逻。在里士满,警察都有一种感觉,就是在一次枪械展览后,暴力案件的发生率就会上升。计算机分析也证明他们的感觉大致正确,但还不够精准——暴力案件发生率的峰值将在枪械展览结束两周后到来,而不是他们认为的展览刚结束的那个周末。

不过,比起人类警察,计算机的优势还是非常明显,因为它们不仅具备惊人的处理能力,而且它们不像人类,在判断时常受到偏见的影响。在2007年出版的一部叫做《数据挖掘和预测分析》(Data Mining and Predictive Analysis)的书中,作者考林·麦库(Colleen McCue,他曾经当过警察)描述了一种违背直觉的现象,该现象是弗吉尼亚州一位研究哪类人更容易成为抢劫犯的犯罪学家发现的。“一般来说,要预测未来的犯罪事件,以前的犯罪史是最可靠的参考资料,这是很正常的,”麦库写道,“但让人吃惊的是,在预测时,以往的财产犯罪往往能比性犯罪更好地预测强奸案。”特别是那种进入别人室内却没有偷到什么东西的人,尤其容易成为强奸犯。他们的目标也许不是盗窃,而是寻找一名受害者。所以,在未来,当计算机标记出一场突如其来的入室盗窃,却又没有什么东西被盗时,住户就必须提高警惕了,一起强奸案或许就在酝酿之中。

预测软件甚至不需要人类警察提供预测理论,尽管这些理论可能有用。通过梳理大量数据,计算机可以自动设计出预测算法,这个过程叫做规则归纳(rule induction)。向计算机输入一系列数据,预测软件就能分析出,是哪些因素的共同作用导致了犯罪事件,这些因素重新组合后,又会如何影响未来的犯罪风险。比如,当某个地方会在周末举办一场枪械展览,而天气预报说该地周末会有高温天气,那将会发生什么?又或者,如果发工资那天,晚上会有一轮满月,又会发生些什么?

尽管有些疯狂,但里士满还是开始实施“预测警务”,然后考察预测效果。每当他们引入一种新的候选因素,例如家长教师协会(PTA)会议的时间表,他们都会对比实际情况与预测结果,对预测模型进行重新评估。那么,这些模型的预测效果到底如何?“最后,预测模型也许只需要使用一小部分候选因素,”IBM的软件工程师比尔·哈菲(Bill Hafey)说:“但这一小部分因素却可以构建起最准确的模型。”

犯罪率下降的这些年

导致犯罪的因素不仅数量多,而且很复杂,想要通过犯罪率,反过来找出主要犯罪原因,难度不是一般的大。尽管如此,有证据显示,孟菲斯“蓝色粉碎”系统之类的“预测警务”技术确实有助于降低犯罪率。自从2006年“蓝色粉碎”项目启动以来,孟菲斯的暴力案件和重大财产案件的犯罪率大幅下降,幅度超过了美国其他地区。

“预测警务”的发展

早在上世纪80年代,已故的纽约交警杰克·梅珀(Jack Maple)就开创了“数字警务”的先河,他用蜡笔和图钉在地图上标记出发生在地铁上的暴力犯罪。梅珀将此称为“未来图表”。这是一个很容易理解的词汇,会让人想起迪斯尼式的更加光明、可以预测的明天。20年过去了,虽然目前的地图分析远比当年复杂,但地图仍然是“预测警务”中的关键工具。

我在孟菲斯参加了一次“蓝色粉碎”项目的每周例会。在宽敞的会议室里,来自孟菲斯8个不同地区的指挥官轮流介绍了自己辖区内的最新犯罪情况。在他们身后,投影大屏幕显示的地图上标注了一些用来代表不同犯罪的图标——包括拳头、破碎的窗户以及盗贼小人,每个图标都代表了在过去一周发生的一起独立案件。

然而,“预测警务”所需的数据远不止近期案件的发生时间和地点。在孟菲斯,一名分析员可能会打开一幅显示近期盗窃案件的地图。然后,他会列出教育局公布的所有未到校上课的学生的家庭住址。第三层数据则会是,哪些逃课学生曾有盗窃前科。如果这些数据产生了联系——也就是说,盗窃案件通常发生在有盗窃前科的逃课学生的住处周边,我们就可以奔赴那些地区去抓盗窃犯了,或者通过地图,找到那些逃课学生的住址。“然后,你可以去那儿查访一下,你可能会惊讶地发现,这里到处都堆放着偷盗而来的赃物,”犯罪活动实时监测中心的主管约翰·哈维(John Harvey)说。

这些算法也开始融入犯罪学家最新提出的理论。例如,传统观点认为,聪明的罪犯不会回到作案现场,但美国加利福尼亚大学洛杉矶分校的布兰廷汉姆和圣克拉拉大学的数学家乔治·O·默勒尔(George O.Mohler)对成千上万起盗窃案,以及洛杉矶警察局提供的逮捕报告进行研究之后发现,一名“成功”的盗窃犯往往反其道而行之。“从罪犯们的角度来看,再次‘光顾’昨天闯入过的民宅是一个不错的主意,”布兰廷汉姆说:“他知道屋里都有些什么,还知道如何迅速进入与逃跑。”而且,布兰廷汉姆和默勒尔还发现,被盗者的邻居遭到盗窃的概率也很高,因为这些住宅的室内摆设和财产情况通常比较相似,对盗贼也极有吸引力。”

布兰廷汉姆和默勒尔还在抢劫、群体暴力以及机动车盗窃领域发现了“重复受害效应”(repeat-victimization effect)。他们确定了这种效应的范围——大约在某入室盗窃案件事发地点的3000米范围内,以及在首次案发之后,被盗风险如何随时间变化。然后,布兰廷汉姆和默勒尔根据他们的发现开发了一种有效的算法,建立了预测模型。与那些仅仅简单假设未来将与过去完全类似的传统模型相比,他们的新模型在预测未来犯罪时,准确率要高出10%~20%。

在孟菲斯召开的“蓝色粉碎”项目例会上,每一幅辖区地图上都标注出了两三个“焦点地区”,也就是未来一周里犯罪事件最高发的地方。一些需要小心提防的特殊案件及相应的发生时间也被重点标注出来。这就是我和坎宁安为什么会选择下午4点到晚上10点这个时间段去暗中巡逻,侦察是否有盗窃案件的原因。

也正是依据这份预报,在当天稍晚一点,我们接到一个求助电话时,前往附近一个叫做“橙色高地”的高危地区进行巡逻。当我们到达的时候,另外两辆巡逻车正闪着警灯,把一辆黑色尼桑车强行拦截在路边。坐在后排的男子携带了50多克大麻、数百张10美元的钞票,以及一个伪装得极像iPhone的天平。当一名警员上前询问天平是拿来做什么的时候,这名疑犯老老实实地承认了他是一名贩毒者。“有时,我的客户会觉得我在欺骗他们,所以我必须用天平来称重,”这名疑犯说道。

犯罪事件的“余震”

犯罪学领域的一些最新研究显示,犯罪活动与地震有一些共同点。特定地区——受害者附近的街区——更可能发生犯罪事件。就跟地震以后还会出现余震一样,一次犯罪活动发生之后,案发地点附近再次发生同类案件的概率也较高。研究者根据他们的认识,创建了一种地图,可以显示出哪些地方在未来几天或几周可能有案件发生。他们先利用前一天的犯罪数据来绘制“余震”地图,以此反映在某一案件事发地的周边地区,发生犯罪活动的几率上升了多少,接着把这幅图叠加到该地区的常规犯罪活动地图上,然后警方就会根据最终地图来分配警力,在最危险的那些地区加强巡逻。

准备谋杀也有罪?

这名毒贩被戴上手铐,关进了巡逻车的后厢。正当我们将他送往地区拘留所的时候,警用无线电广播传来了一个紧急呼叫:“山脊路和西克里山附近的6011公寓旁发生枪击事件。”第二天早上,我上网查看了这起事件的相关报道。受害者名叫克劳德·布雷克(Claude Brake),他是一名56岁的退伍军人,目前在棒约翰比萨店(Papa John’s Pizza)工作。在送外卖的路上,两名大男孩拦下他,向他要钱,但遭到拒绝,于是其中一名男孩开枪杀死了布雷克。

即使在孟菲斯这样的大城市,谋杀也不多见。孟菲斯在2010年一共报道了25324起盗窃案,但谋杀案仅90起。如果要想构建一种可靠的预测算法,在歹徒实施杀害之前将他逮捕,从统计学上讲,这点数据远远不够。布雷克遭到枪击的地点在坎宁安辖区中的焦点地区之外,而每周的例会上并没有提到这里可能会发生暴力案件。即使是詹尼柯斯基这样的支持者也很快指出,虽然运用了高科技并进行了完善的培训,但迄今为止,预测工作仍然还很不成熟。“我更倾向于用‘犯罪预测’来描述我们的工作,而不是‘犯罪预报’,”詹尼柯斯基说:“相关技术还不够完美。”

尽管从目前来看,警方连哪些地方可能发生谋杀案都还没法预测,但一些研究者认为,在预测谁将会是杀人犯上,我们可以做得更好。理查德·贝克(Richard Berk)是美国宾夕法尼亚大学的犯罪学教授,他开发了一套算法,能够评估一名被假释或被判缓刑的犯人在未来杀人的概率。这种算法是基于对上万起案件的深入调查,算法中的参数包括年龄、性别、犯罪类型、首次犯罪的时间等。“在预测哪些人可能杀人上,该算法的准确率能达到75%,”贝克说。

这类强大的犯罪预测技术也带来了一个难题:我们可以在一个人实施犯罪之前判定他有罪吗?布兰廷汉姆等研究者认为,“蓝色粉碎”之类的项目并不会涉及这种问题。“这不是预测特定个体的行为,”布兰廷汉姆说:“而是在空间和时间上,预测特定犯罪类型的发生几率。”警方使用了他开发的分析工具后,所采取的措施并不是在自由公民实施犯罪之前就把他们关押起来,而是在那些高危人物出没的地区加强巡逻而已。

不过,贝克的工作更容易触及伦理道德的界线,因为根据他的方法,可以预测哪些人释放后,可能会很危险,而这种预测会影响假释委员会的决定。但是,对犯人在假释之后的行为作出判断,本来就是假释委员会应该做的,贝克说。唯一的区别在于,现在他们是借助计算机分析技术来评判,而以前,几乎只能靠委员会成员的主观臆测。

在质疑中前行

自从孟菲斯警局在作出主观判断的同时,加入了越来越多的计算机分析,5年来,严重的财产和暴力犯罪率下降了惊人的25%。但是,尽管从表面上看,这一成就都归功于“预测警务”,我们仍然很难判断,在孟菲斯或者其他地方,犯罪率的下降究竟在多大程度上,是因为计算机软件的功劳。在美国,和孟菲斯规模相当的其他城市的犯罪率也在大幅下降,但其中一些城市并没有实施类似“蓝色粉碎”项目的行动。

而且,就像每位犯罪统计学家都知道的,你所选择的作为参照的年份(即以后每年的情况都会与这一年相比较),对最终结果的影响会非常大。以孟菲斯为例,选择2006年作为参照年份算是比较合理的,因为“蓝色粉碎”项目就是那一年在孟菲斯开展起来的。但是,2006年恰恰是本世纪头10年中犯罪率最高的一年,这就是说,以2006年为参照,后面几年的情况似乎都有较大程度的改善。还有一种对比方式是,拿“蓝色粉碎”行动开展以来这5年(2006年—2010年)的平均犯罪率,与此前5年(2001年—2005年)的数据做比较。如果以这种方式来看这几年的变化情况,孟菲斯的犯罪情况其实并不那么乐观:在这10年的后半段,财产犯罪率仅下降8%,而暴力犯罪率上升了14%。

“蓝色粉碎”项目于2006年启动不是巧合,也不是故意在统计学上耍小聪明,而是因为犯罪率当时已经到达顶峰,布兰廷汉姆说。“2006年时,我们意识到,过去两年的犯罪率一直在攀升,而我们当时的工作都没有起到任何效果,”他说:“我们当时必须要有新动作。”布兰廷汉姆指出,警方在“蓝色粉碎”项目中采用了很多种方法,其中就包括“热点执法”(hotspotpolicing)这种业已通过大规模研究严格论证的有效手段,犯罪率也从2006年起逐年下降。但是,“‘预测警务’的效果已经得到证实了吗?”他问道,“这就是说,对于这种方法,你提出任何质疑都是合理的。”

执法领域的各类人士也试图找出答案,美国国家司法研究所(National Institute of Justice)已经插手此事。他们最近给美国7座城市的警察局划拨了专款,包括波士顿、芝加哥、纽约、洛杉矶、华盛顿,希望通过严谨的对照实验来评估“预测警务”的效力。例如,洛杉矶警察局和布兰廷汉姆将会开展一个比较实验,看用了“重复受害模型”与没有用该模型的地区,在犯罪率上有什么不同。为了保证结果的准确性,所有城市的评估结果都将再次接受兰德公司(Rand Corporation,美国最重要的以军事为主的综合性战略研究机构)的评估。布兰廷汉姆对此表示了谨慎的乐观,“我们即将跨入一个新的警务时代”。也许,他的这句话很快就能得到证明。

扩展阅读
  1. Self-Exciting Point Processes Modeling of Crime. G. O. Mohler, M. B. Short, P. J. Brantingham, F. P. Schoenberg and G. E. Tita in Journal of the American Statistical Association, Vol. 106, No. 493, pages 100–108; 2011.
  2. How New York Beat Crime. Franklin E. Zimring in Scientific American, Vol. 305, No. 2, pages 74–79; August 2011. Federal Bureau of Investigation Uniform Crime Reports: www.fbi.gov/about-us/cjis/ucr
原文来源: 环球科学•数学篇
作  者: James Vlahos
翻  译: 张燕晶
推荐人: 刘明,《环球科学》新媒体经理/资深编辑