“我们应该对人工智能非常小心……借助人工智能,我们正在召唤恶魔。”-麻省理工学院百年纪念研讨会的埃隆·马斯克(Elon Musk)。
随着技术的发展,新的风险和欺诈机会不断升级。我们已经看过“ ”视频,其中操纵着名人或政客的图像以说或做他们从未做过的事情。是一种基于人工智能(AI)的人类图像合成技术。最初被视为“图像”应用程序的,如今已被用于模仿语音。今年是首次报告的一次AI生成的语音欺诈事件,用于进行重大欺诈。
根据《华尔街日报》2019年8月的一份报告,一家英国公司的首席执行官被迫利用语音将超过243,000美元转移给网络窃贼。这家身份不明的公司的首席执行官认为他正在与他的老板(德国母公司的首席执行官)通电话。在用“声音”说话后,他按照命令立即将220,000欧元(约合243,000美元)转入匈牙利供应商的假银行账户。
该声音属于使用AI语音技术模仿该公司德国首席执行官的罪犯。这种新的网络欺诈形式由位于慕尼黑的金融服务公司 SE的子公司Euler Group SA保险。欧拉·爱马仕(Euler )的鲁迪格·基尔希(Rü)表示,受害者甚至认出了老板的德国口音,甚至带有他特定的声音“旋律”。
网络贼打了三次电话。首先是发起转移。第二,以欺骗手段声称已偿还。第三人寻求后续付款。那时,毫无戒心的目标注意到还款没有出现。然后,他注意到电话来自奥地利的电话号码。第二笔付款已暂停,但第一笔已从匈牙利帐户转至墨西哥的一笔,然后已拨至多个国际地点。
这怎么可能?我们如何开始理解令人信服的语音怎么可能?一家公司不仅声称发明了这项技术,而且还吹嘘它。今年夏天,来自总部位于多伦多的AI公司Dessa的研究人员宣布,他们已经对流行的播客和喜剧演员Joe Rogan进行了完美的语音模拟。
根据Dessa的说法,他们制作了迄今为止所听到的最逼真的AI语音模拟。他们的原始资料是Joe Rogan,他是美国最受欢迎的播客主持人之一。迄今为止,他的节目已播出超过1,356集,为技术吸收了数小时的语音样本。
Rogan语音的模仿是使用名为的文本到语音程序创建的,该程序仅使用文本输入即可生成逼真的语音。因此,用户只需要键入单词,无需讲话。最终结果包括微妙的细微差别,例如呼吸以及“ ums”和“ ahs”。如果有足够的数据可用,该程序将能够模仿任何人的声音。