社交网站的演示视频中,手一挥一秒换脸的视频比比皆是,每个人都能用AI制作一段视频,骗子也不例外。
AI音乐、AI绘画、AI换脸、AI换声……不知不觉中,我们每个人都已经走进了赛博世界,不管是抖音中的#一键解锁瞬息全宇宙##一键变妆#等特效的应用还是AI孙燕姿的“消费”,都是AI日常化的见证。
在所有人都在享受技术狂欢的时候,技术的另一面也逐渐显露:伪造技术和鉴别技术好似在玩一场“猫鼠游戏”,最终谁能把握主动权?
可以批量生产的AI换脸,技术门槛有多低?
AI换脸技术并非新事物,早在2019年,一个换脸软件“ZAO”的出现,就曾让AI换脸风靡网络,网络视频平台上出现大量的AI换脸恶搞视频,许多明星因此被恶搞、造谣。
尽管,当时“ZAO”上线不久便因侵犯隐私等问题被下架,但这个由技术带来的负面影响却一直存在,直到今年AI技术的普及使得换脸再次爆发。
瑞莱智慧联合创始人、算法科学家萧子豪表示,AI换脸、AI换声主要使用的是深度合成技术,随着深度合成技术的开源开放、深度合成产品和服务的增多,深度合成内容制作的技术门槛越来越低,实现了技术的“平民化”,普通人也能用少量图像、音频等样本数据,利用简便易用的合成工具,制作深度合成内容。
萧子豪介绍,目前视频聊天或直播的AI换脸有两种方式:一种是事先做好的换脸视频直接播放,一种是接入实时换脸的视频。第一种方式,目前的制作成本已经非常低,有公开成熟的应用可以支持该项工作;第二种虽然没有发现有公开的应用,但也有非常成熟的技术手段可以支撑。做成一段视频的时间和设备、算力等因素相关,当前技术可以做到和生成视频相等的时间即产出结果。制作这样的视频需要被替换前的原始视频图像和被替换后的人脸图像,基于目前的技术能力,替换前的原始视频图像在面部清晰、正脸无遮挡、无夸张动作等条件下,会展示出比较好的效果。
AI从业人员汤辉也表示,现在的AI换脸对技术的要求非常低,“如果是专门的技术人员,在网上找一个开源的模型,然后先自己搞懂。如果只是采集一段这个人的图像生成视频,很快就能训练出来。20分钟就可以做一个。”
在手机应用商店搜索“AI换脸”可以发现,有不少相关软件,其中在ios系统的下载量已达24万,该软件有影视角色、写真、漫画等模板。软件采取收费获取模版的形式盈利,周会员17元,年会员398元。也有的软件只需看广告就可以制作。
换脸软件下载和收费界面 图片来源:截图
电商平台上虽已屏蔽“换脸”等关键词,但通过搜索其他相关词条仍能找到相关内容,售价多在几十元。
某电商平台售卖AI换脸产品的详情介绍 图片来源:网页截图
抖音等短视频也推出简易AI换脸模板,比如换脸跳舞、变脸换装、男女换脸等。记者尝试导入照片后几秒钟便可生成一个视频,但这类视频精度相对较低,偶尔转头还可以看到一些不贴合等漏洞。
此外,许多大型科技公司也在着力布局相关业务,AI概念股万兴科技(,股价136.60元,市值188.09亿元)落地了AI换脸、AI抠像、AI降噪、AI音频重组等多项AI能力。据媒体报道,5月25日万兴科技旗下的万兴播爆已全面上线AI数字人定制服务,支持数字人形象定制、声音复刻和视频模板定制。用户只需录制一段6分钟左右的视频和20句有效音频语料素材,便可生成“真人”“真声”专属数字人。
“目前AI已经可以批量制作大量的视频,制作多段替换成同一人物的视频,也可制作同时替换为多位人物的视频。”萧子豪说。
为AI打标记,一场“猫鼠游戏”
“技术只会发展得越来越快,也许你现在能看出来是AI,还是真人,但是半年后,一年后呢?”汤辉认为AI技术发展太快,但是现实生活中了解AI的人又太少,进而导致诈骗频繁发生。
萧子豪也表示,目前深度合成技术在不断进化,生成的声音和视频越来越逼真,普通人肉眼鉴别的难度也越来越高。
据媒体报道,微软首席技术官(CTO)凯文·斯科特在当地时间5月23日开幕的Build开发者大会前夕接受采访时曾表示,微软3年来一直在研究“媒体来源系统”——在AI生成的内容里放置加密水印,可以使用软件解密水印以获取来源信息,以检测虚假信息。
从技术上来看,萧子豪介绍,他们一直在研究深度合成技术的自动化检测,常用的方法包括基于伪造内容数据集完成对模型检测器的训练、基于帧间不一致性实现对伪造内容的判别等,这些方法在开源数据集中均能达到99.9%的准确率。
“防范的难度在于新型伪造方法层出不穷、网络传播环境日趋复杂,加上基于深度神经网络的检测算法存在结构性缺陷等,反深伪检测技术也面临‘强对抗性’,需要持续更新与迭代优化。”
类似于“猫鼠游戏”,萧子豪说,深度合成和检测在不断学习攻防过程中会自我进化,规避上一代的对抗技术。为了能在对抗攻防中掌握主动权,未来反深伪检测技术的发展需融合多模态内容的取证分析、基于数字水印的溯源技术等多方面能力,实现伪造内容的精准识别,打造可信内容体系。
《互联网信息服务深度合成管理规定》明确要求深度合成服务提供者对使用其服务生成或者编辑的信息内容,应当采取技术措施添加不影响用户使用的标识,对于具有生成或者显著改变信息内容功能服务的,应当在生成或者编辑的信息内容的合理位置、区域进行显著标识,向公众提示信息内容的合成情况,避免公众混淆或者误认。
记者注意到,目前b站已经在一些视频上为AI合成视频打上明显标记,抖音在5月9日发布了关于AI生成内容的平台规范暨行业倡议,倡议各生成式人工智能技术的提供者,均应对生成内容进行显著标识,以便公众判断。同时使用统一的人工智能生成内容数据标准或元数据标准,便于其他内容平台进行识别。