江寒退场后,邓飞又做了一些部署,让组员们分头行动,收集线索。
不管是否有外援,该做的事情一样也少不了……
隔壁房间。
李建离开了一小会,再回来时,带来了一套台式计算机。
两人迅速组装起来,联网,然后开机。
江寒摆弄了几下,发现这台机器性能颇为优秀。
这让江寒很是惊喜。
对他来说,笔记本虽然也能用,但不够顺手,偶尔用一下还行,长时间、高强度工作还是算了。
更让他开心的是,这台电脑里居然还部署了他需要的编程环境。
这就意味着,他至少可以节省1个小时以上,用来安装、调试开发工具,配置系统环境的时间。
“这电脑配置不错啊!谁的?”江寒随口问了一句。
“我的。”李建有些不好意思。
这个配置在全局都是最高的了,实在找不到更好的了……
“不知您是否满意?”
江寒点头:“特别满意。”
接下来,就该实践自己的想法了。
首先要搞清楚现有人物识别系统采用了哪些技术路线。
要达成这个目的,办法不少,比如“逆向工程”……
但江寒不想浪费时间,于是直接打电话给黑天。
听说江寒打算改造人物识别系统,黑天并没有如何惊讶,马上将这套系统的基本情况介绍了一遍,并答应给江寒一份原始工程文件。
临挂电话,又嘱咐江寒:“如果改进成功后,别忘了提交给总局一份,算你再立一功……”
挂掉电话后,江寒稍微等了一会儿,就收到了黑天发来的压缩文件包,里面正是那套系统的工程文件,包含了全部源代码。
江寒粗略浏览了一遍,便开始思考接下来的步骤。
这套系统的框架其实十分优秀,换做江寒亲自开发,也未必能超越多少。
现在的问题是,这套系统中,有关人脸、身形的识别和比较的子模块,性能稍微有点弱。
无论国内还是国外,治安管理方手中都掌握着类似的程序,但一般只能识别比较标准的正面照。
用在角度刁钻,清晰度过低的嫌疑人照片上,识别率就很一般了。
至于嫌疑人乔装改扮过……实话实话,这种情况下,识别效果根本没法期待!
直接改进源代码,难度极高,意义也不大,最好的办法,就是重写图形识别、比较模块,挂接到原有的框架中。
而对于图形图像识别,最适合的技术,莫过于“卷积人工神经网络”。
唯一的问题是,需要针对具体情况,重新加以训练,以得到适用的参数、超参数……
想清楚了步骤后,江寒便开始动手操作。
先是在李建的辅(监)助(督)下,从部署在“大江公司”地下的服务器里,下载了一份代码。
就是参加KAGGLE比赛的那份,然后在其基础上稍微改了改,让其适用于解决当前的任务。
这也是神经网络的一个独特优势,网络架构不必大幅改变,只要提供合适的数据出入口,再调整一下超参数,就可以应用于不同任务。
接下来,需要训练这个巨型CNN网络。
一般来说,神经网络的训练十分吃算力,而现在时间又很不充裕。
这样一来,江寒只能稍微变通,降低了对识别准确率的追求。
“宁可抓错,但勿漏掉”。
这在他之前改动程序时,已经有意识的去做了。
另外,江寒又打了个电话给黑天,问能否帮忙协调一下,“借”台超算用用,提升一些训练速度。
结果很遗憾,黑天告诉江寒,目前官方的几台超算,计算任务都排满了,至少一个月之内,抽不出空余算力。
而这次的案子,对华阳治安方面来说,是必须重视的大事,但在全国范围内,从大局上看……
总之一句话,公家的免费超算就别指望了,想提高训练速度,只能自己想办法。
“实在不行,你先花个三、五天,把东西弄出来,就算这次让‘鬼才’跑了,下次也还有机会抓。”黑天安慰了一句。
江寒微微叹气,他可不习惯拖延,最好今日事、今日毕。
想了想,问黑天:“我自己找超算,私车公用,这没问题吧?”
“那随便你,甚至花了多少钱,我可以看情况帮你报销一些。”
黑天淡淡地回答。
但紧跟着他又提醒江寒:“当然,最好别用境外的超算,免得引起不必要的纠纷。”
江寒笑了笑:“知道了。”
顿了顿,补充说:“大江公司有超算,性能勉强够用……”
黑天:“……”
差点忘了,这小子自己家就是开科技公司的……
“可以。”
黑天当即批准,见江寒再没其他问题,就迅速挂断了电话。
——论忙碌程度,他并不比江寒稍差。
江寒改好程序后,上传到了大江服务器中,然后在服务器中部署了一下,让其调用超算的计算资源,训练这个CNN。
有了超算加持,再加上网络的性能要求被调整到了最低,这次只用了三个小时,就完成了初步训练。
在等待的过程中,江寒已经将图像识别、比对系统的框架、接口研究透彻。
训练一完成,就立即将大小超过3g的参数文件,下载到了华阳这边的台式机中。
然后将CNN和参数文件整合到一起,挂接到系统中,替换掉了原来的人脸识别模块。
时间允许的话,还可以将原来的接口扩充一下,搞成“双引擎”的工作模式。
但这需要改动界面,比较麻烦,眼下没那个闲。
所以……先凑合用吧,将来有时间了,再去锦上添花。
系统改造完成后,江寒调试了一番,排除了几个小BUG,感觉没啥大问题,便试运行了一下。
系统启动后,很快展示出堪称简洁的界面。
江寒通过菜单,先进入人物图像匹配模块,然后进行了一些简单的设置。
接下来,选定那张疑似“鬼才”的嫌疑人照片,让其显示在窗口左上角。
照片上的人,看起来不过30上下,气度潇洒不羁,长相的英俊程度,堪比流量小生。
实话说,如果这人真是“鬼才”,也只能惋惜一句“有才无德”。
“这照片怎么来的?”江寒问。
“鬼才生前的驾照。”李建回答。
生前……
江寒一阵无语。
好吧,估计又是诈死埋名。
这样一来,其“生前”的种种官方记录,就基本失去了用处。
当然,这也解开了江寒的一丝疑惑。
——若非如此,以华夏对人口的掌控力度,早就将他揪出来了,又怎会容许他逍遥法外这么久?
接下来,江寒利用系统菜单,将各种需要对比的图片,作为数据源导入、挂接了进来。
治安系统的权限很高,可以访问几乎所有途径采集到的各种图像、数据。
其中,有华阳过百万人口的档案照片,也有来自机场、高铁站、酒店等地方的监控录像,还有各种来源不便公开的照片。
只要将这些数据与原始图片进行比对,就算不能直接锁定嫌疑人,也能排除掉大多数不相干的人,缩小排查圈子。
江寒点击了一下【开始比对】按钮,于是,右边的预览窗里,密密麻麻的缩略图,便飞速滚动起来……
数据量实在太大,再快的电脑也需要不少时间。
江寒和李建足足在电脑前轮流守候了六个小时,第一轮筛选结果才出炉。
这个时候,天色已经接近大亮。
别说外面的会议早就散会,某几个工作狂人,甚至都回家睡完一觉,又回来上班了……
江寒操作电脑,切换到输出文件夹。
这里保存了超过500张图片,各式各样的人都有。
这些人与嫌疑人在脸型或者身形方面,相似度超过了某个阈值,于是作为可疑对象,被系统筛选了出来。
接下来,只要将他们全都“请”过来,一个个过筛子……
李建迫不及待地翻阅了一遍输出图片集,有些半信半疑:“这里面真藏着嫌疑人?”
不少图片里的人物,和嫌疑人照片相比,差距不是一般的大。
年龄从老到少,多大岁数的都有,甚至有一些图片里,连性别、身高都大相径庭。
有些说是两个不同的人,也半点不为过。
江寒微微一笑:“有几率,不一定。”
这是实事求是的说法,鬼才要是那么好找,也不会逍遥到现在了。
但不管怎么说,总比原先那样没有目标、乱打乱撞来的强。
李建将500张图片打成了压缩包,拷贝到U盘里带走了。
接下来有关排查的事,就全部交给专案组其他成员了,江寒只需耐心等候结果。
李健走后,江寒又操作电脑,让其自动进行第2轮筛选,自己则找了张长条皮椅,稍微小憩了一会儿。
李建出门后,迅速将500多张图片展示给领导看。
任飞粗粗看完一遍,立即紧急召集专案组组员,将任务分配了下去。
在各片区自然队员的协助下,当天下午两点之前,这500多人便全数被找到。
有的被请到了市内各个片区派出所协助调查,也有一小部分,直接被带到了治安大厦……