日前,Boing Boing在网上发布了一份长达96页关于英国情报机构GCHQ数据挖掘技术的电子书—《数据挖掘研究问题书(Data Mining Research Problem Book)》。据悉,这份文件最早由爱德华·斯诺登获得。
Boing Boing为这本电子书打上了一个“可能发生的最糟糕的情况是什么?”的副标题,并对其进行以下描述:一种为想要利用恶意软件寻找许可、感染敌人电脑或网络的间谍所使用的清单。
从电子书中了解到,这份数据挖掘手册由来自海尔布隆数学研究所的研究人员和GCHQ和布里斯托尔大学的研究人员联合编写。据Boing Boing披露,相关人员一半的时间花在公共研究工作上,而另外一半时间则用在政府的秘密项目开发上。
手册为GCHQ数据挖掘工作提供了非常具有价值的见解,至少在2011年9月编写完成的时候是非常有用的。那个时候,一些“传输者”—互联网连接—其速度为10 gigabits/s。而手册中写道:“一个10G的传输者可以生产巨大的数据。为了让它们变得可管理,首先要做的就是丢掉大部分我们看得到的数据包。”
然而重要的是,其实被丢掉的只是内容,而非源数据。这也就证实了GCHQ在对源数据监控中所扮演的中心角色,换句话说,这个机构甚至有可能在《监听者宪章(Snooper Charter)》到来之前就已经开始数据收集了。
还有值得注意的部分则是隐写术—将信息隐藏在另外一个文件中,其中一个常用的办法就是通过对JPEG图像系数的修改将数据藏在里边,与此同时,对图片的改变则要尽量保持最小化。
不过手册中大部分内容都集中在GCHQ大规模源数据储存的审查上。
当有外媒就这一份文件真实性向GCHQ求证时,该机构发言人称:“我们不对此做评论,”仅简单地提供了一个非常官方的回应。
本文转自d1net(转载)
相关资源:从斯诺登事件看网络信息安全