找回密码
 立即注册
搜索

揭秘:美国国安局(NSA)的语音识别技术

点击标题下「大数据文摘」可快捷关注

FreeBuf黑客与极客授权转载

摘自:www.FreeBuf.com

原文:http://www.freebuf.com/news/66747.html

斯诺登泄密各种美国国安局(NSA)的“黑科技”之后,米国人民似乎意识到了无论什么样的通信方式都逃不过来自政府的监控,NSA甚至早在40年前就可以识别语音了。

语音识别技术可追溯到20世纪70年代

要想更好的理解这是怎么一回事,就要追溯到20世纪70年代:当时美国国防高级研究计划局(DARPA)首次出资研究语音识别技术,在此阶段有好几个项目都可以将语音转换成文本格式。尽管当时的进程很缓慢,但是,通过技术的不断提升,识别的进程变得越来越快,获得的数据也越来越多。

DARPA信息创新办公室主任Dan Kaufman称:
将语音转换成文本的方法是非常困难的,因为通话中往往会有很多其他的噪音信号干扰,我们不是很擅长排除这类的干扰,但是我们也正在慢慢的擅长翻译这些信息。
2001年之后,对间谍工具投入的资本有了显著的增加,从斯诺登文件中甚至可以发现,十年前NSA分析师对“Google for Voice”的诞生是非常开心的。

然而任何工具都不能做到完美的翻译语音对话,至少现在还没有这样的工具;但是不可否认的是当前的一些工具着实很强大,通过大范围的关键词搜索、提取语音对话信息、使用算法标记对话等方式使得翻译更加的准确。

斯诺登文件还指出,美国情报中心已经在一些战区(如,伊拉克、阿富汗、拉丁美洲)使用这种工具进行监听了,但是他们却不会监听美国公民的通话信息。也许全球的公民都应该保持警惕了,因为美国情报机构是使用雷达进行活动的,就连美国国会也觉察不到他们的活动。

语音转换工具及其发展史

2001年爆发的一次恐怖分子攻击活动,攻击者就是用类似的工具,以自动化的方式搜集到了大量的语音通信数据。

第一代语音转化工具:RHINEHART

第一代工具叫做“RHINEHART”,首次出现在2004年。NSA一个叫做For Media Mining, the Future Is Now!的内部文件(2006年)中指出:
语音搜索技术可以帮助分析师快速的查找情报内容,并能根据情报内容优先拦截部分通话。RHINEHART同时支持实时搜索和回顾搜索,这样一来分析师们即可查到当前的通信信息,还可以查到过去的通信信息。
2006年的时候RHINEHART就能够在多种语言中进行翻译了。其中西班牙语在转换中的准确率最高。

第二代语音转化工具:VoiceRT

2009年,VoiceRT开始出现,首次用在巴格达地区,它的目标是每天能检索并标记100万份信息。



第三代语音转化工具:SPIRITFIRE

在2011-2012年间又出现了一个新工具,叫做“SPIRITFIRE”。它能处理更多的数据,并且速度更快,在语音-文本的关键字搜索和配对对话转录功能基础之上拥有更加稳健的语音处理能力。

作为一个普通的公民,我们希望相关机构充分尊重我们的权利,严格管理这类工具,并立法保护我们的隐私。

参考来源securityaffairs

大数据文摘精彩文章:

回复金融 查看【金融与商业】专栏历史文章

回复可视化 感受技术与艺术的完美结合

回复安全 关于泄密、黑客、攻防的新鲜案例

回复算法 既涨知识又有趣的人和事

回复谷歌 看其在大数据领域的举措

回复院士 看众多院士如何讲大数据

回复色情 这个,你懂的,可是你真的懂吗?

回复隐私 看看在大数据时代还有多少隐私

回复医疗 查看医疗领域文章6篇

回复征信 大数据征信专题四篇

回复大国 "大数据国家档案"之美国等12国

回复体育 大数据在网球、NBA等应用案例

回复平安 中国平安相关大数据案例、新闻

回复志愿者了解大数据文摘及如何加入

大数据文摘ID:BigDataDigest

专注大数据,每日有分享

覆盖千万读者的WeMedia联盟成员之一

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
回复

使用道具 举报

大神点评2

狼飞天地 2022-6-17 07:05:39 显示全部楼层
垃圾内容,路过为证。
回复

使用道具 举报

caonmeng 2022-6-19 22:36:34 显示全部楼层
楼猪V5啊
回复

使用道具 举报

高级模式
B Color Image Link Quote Code Smilies