11月19日讯 UpGuard公司安全研究员克里斯·维克瑞表示,他发现三台隶属于美国国防部(简称DoD)的错误配置Amazon S3服务器,其中包含来自世界各地用户的18亿份社交媒体与论坛发帖,不少美国民众的言论信息也包含于其中。
而这批数据库分别被命名为“centcom-backup”、“centcom-archive”以及“pacom-archive”。
根据名称来看,这些数据库明显属于美国中央司令部(简称CENTCOM)与美国太平洋司令部(简称PACOM)两大国防部下辖的军事指挥部门。
数据库内容全部来自公开互联网
根据克里斯·维克瑞的说法,数据库中的信息并不包含任何敏感细节。相反,这些数据库完全由收集自互联网的公开社交媒体帖子、论坛帖子、博客、新闻评论以及其它类似的信息片段拼凑而成。
这批整理起来的数据包含帖子本体以及用于识别帖子的数据。大部分内容使用阿拉伯语、波斯语以及英语编写而成,且收集时间为2009年至2017年8月之间。
根据数据库中的数据结构来看,其似乎属于混合Lucene-Elasticsearch搜索引擎中的一部分。
根据维克瑞的评估,这批数据库很可能是由美国情报部门进行存放,旨在利用互联网获取可能有助于其行动的信息。
在一个被标记为CENTCOM的S3存储桶当中,研究人员发现一个名为“Outpost”的文件夹,这似乎代表着这项工作由前软件供应商VendorX负责——这家公司曾经为国防部承包商,负责开发大数据搜索引擎技术。
数据库现在已经得到保护
在发现这批数据库后,维克瑞于今年9月与国防部方面取得联系,而相关数据库很快得到保护。
这些数据库并不进行公开访问;相反,其要求用户拥有Amazon AWS帐户。不过一个免费帐户就足以访问并下载存储在三个S3存储桶内的全部数据。
上周,Amazon公司更新了AWS后端面板,并在S3服务器上线时添加了可见警告。该公司之所以作出这样的决定,是因为相当一部分企业客户曾经遭遇S3服务器配置错误所引发的敏感数据意外曝光。
有些人可能会批评五角大楼对美国公民的社交媒体信息进行收集,并将其作为“秘密监视计划”中的一部分。然而,利用互联网公开信息并不违法,一部分私营企业甚至以此作为主要业务,并将信息出售给需要的社交媒体及互联网监控机构。这里的问题并不在于互联网利用方式,而是就目前来看,军方并无力控制各第三方承包商以确保数据不致产生在线泄露。