*海报素材源于
编者按:
相信每一位关注、使用过的用户,都能够真切感受到其与历代人工智能聊天机器模型的迥然不同。面对这波现象级话题的热点:“将使哪些人最先失业?”,新媒体运营/新闻/传媒工作者被一次次置于该话题的暴风眼。3 月 1 日, 官方宣布,开发者现在可以通过 API 将 和 模型集成到他们的应用程序和产品中;3月15日凌晨,发布了多模态预训练大模型GPT-4;3月16日微软正式把的GPT-4模型装进了套件,推出了全新的AI功能;3月25日 宣布 将支持新的第三方插件,这可谓是类似于苹果的 App Store 时刻,为人工智能聊天领域带来了新的可能性。
对文化传媒学院的师生来说,这轮新的科技革命将对新闻传媒行业带来怎样的影响、挑战与变革呢?我们邀请了文化传媒学院四个专业的教研室主任(数字出版、新闻学、网络与新媒体、广播电视编导)与国际项目负责人,将陆续在“质量思享汇”对该话题展开探讨,以助力大家更加理性、多元地看待人工智能与新闻传媒行业的关系、人工智能与人类社会的关系。
本文由网络与新媒体教研室主任罗丽霞老师撰写,从决策式AI到生成式AI的发展,AI技术与应用实现了人工智能从分析功能到创造性功能的升级,迎来跨越发展。的爆火,传媒人或将面临“失业”危机冲击。本文将带领读者一起思考传媒行业如何面对人工智能技术自动生成内容(AIGC)的技术革新,探索有效的人机协作机制。
全文共计四千余字
预计阅读时间8分钟
PART 1
背景
2022年11月底研发的人工智能聊天机器人发布,一周时间用户破百万,推出两个多月月活用户便已突破1亿。谷歌、微软等也纷纷着手开发竞品。今年2月初,百度推出“文心一言”的项目,腾讯、华为、阿里巴巴、京东、网易有道、小米等众多互联网公司也均表示计划涉足项目。以“生成式人工智能”为核心技术的崭新成果,在全球互联网界、学术界及产业界引发热议和关注。
回看之所以能够被广泛热议,主要得益于其底层数据、核心技术下的里程碑意义,强大的运算功能、广泛应用的场景、良好的用户体验以及开源社区的支持,使得几乎能无所不能。凭借其优秀的语言理解、意图识别、逻辑推理、内容生成等交互能力,某种程度上满足了大众对人工智能的认知与使用需求。
从决策式AI到生成式AI的发展,实现了人工智能从分析功能到创造性功能的升级,AI技术与应用迎来跨越发展。AI的急速发展使得AI模型在手写识别、语音识别、图像识别、阅读理解、语言理解等领域的表现呈现逐渐加速并超越人类平均水平趋势。3月中旬推出的GPT-4拥有多模态能力,可以接受图像输入并理解图像内容。GPT-4在各种职业和学术考试上表现和人类水平相当,比如模拟律师考试,GPT-4取得了前10%的好成绩;做美国高考SAT试题,GPT-4也在阅读写作中拿下710分高分、数学700分。如此看来,GPT-4几乎可以超越相当一部分人,诸多岗位可能会面临被其取代的风险,尤其内容生产行业,面临巨大冲击。在“失业”危机冲击下,传媒人该如何正确认识和应对生成式人工智能,成为爆火下更值得思考的问题。
—
图源 官网
PART 2
从工作原理
看生成式AI的创造性
是一种机器学习自然语言处理模型的扩展,能够读取学习大量文本数据,并推断文本中单词之间的关系。基于基础上,将人类反馈纳入训练过程中,使模型的输出与用户的意图更好地结合。其作为具有思考力的人工智能聊天机器人程序是基于GPT-3.5架构的大型语言模型展开强化学习进行训练并达成目标。要理解其工作原理,首先要看GPT,即“生成式预训练”模型:“G”-生成(),用户输入一组标签,AI就能根据标签输出一个样本;“P”-预训练(Pre-),其目标是使AI依靠一定数量样本来实现高质量的训练成效,所以针对具体应用场景投入海量算力进行训练以具备类似人脑的能力;“T”-转换器(),利用模型对调输入和输出进而完成识别生成。
▼
的训练过程分为三个阶段
第一阶段:训练监督策略模型。为了让其具备理解指令的意图,会在数据集中随机抽取一定问题,人工进行标注给出优质回答,然后根据人工标注数据进行模型微调,获得SFT模型。
第二阶段:训练奖励模型。在此过程中通过人工标注训练数据反复进行训练,对于数据集中随机抽取的问题进行多个回答,人工对这些结果综合考虑后排序。依据排序结果数据来训练奖励模型。对多个排序结果,两两组合,形成多个训练数据对,高质量回答打分高于低质量回答。
第三阶段:强化学习。采用PPO(近端策略优化),利用第二阶段训练好的奖励模型,靠奖励打分来更新预训练模型参数的方式进行优化。
由此,我们可以把的工作原理基本分为五个步骤:
◎基于用户输入信息进行标签提取;
◎基于提取标签计算输出的标签;
◎基于输出的标签搜索语料库,得到候选语料;
◎提取候选语料的元素并进行重组;
◎计算每一个组合的概率,综合质优(得分最高)项目作为输出。
由此可见,在工作过程中,是一个不断学习、优化、创造的过程。通过让反馈模型与原模型进行对抗强化训练, 对原模型中不当的输出结果不断进行纠正,从而引导出一个不仅符合人类语言习惯,还符合人类偏好和价值观的语言生成模型。
生成式AI不断通过从数据中进行要素学习,进而生成原创的、全新的内容或产品,不仅能够实现分析、判断、决策功能,还能够突破传统AI力所不及的创造性功能。在此过程中,生成式AI的发展离不开算法、算力和数据的支持。
PART 3
生成式AI在内容生产领域的应用
推出以来,更是以其支持多轮对话、易于修正、人机交互效果更高效等优势,广泛应用于人工智能客服、搜索引擎、智能客服、虚拟人、代码编程、文学创作等领域。生成式AI已应用于建筑、设计、营销和内容领域的创造性工作,并逐步推广至医疗、制造、科学、媒体、娱乐等领域。生成式 AI的应用场景分为消费端和生产端,从消费端的角度来讲,随着内容生成的不断便利,无论是可消费的产品数量、质量,还是多样性,都呈现大幅的提升趋势。与此同时,由于生成式 AI 可以帮助人们完成很多繁琐的工作,简化工作,促进消费者效用的提升。
—
图2内容生成发展阶段
▼
在内容生产领域,在专业生成内容(PGC)和用户生成内容(UGC)之后,人工智能技术自动生成的内容(AIGC)成为了一种新的生成内容方式,并且不断升级优化,在娱乐媒体领域广泛应用,冲击着之前的内容生产方式。2022年8月美国科罗拉多州举办的新兴数字艺术家竞赛中,毫无绘画基础的参赛者的AIGC绘画作品《太空歌剧院》获得了此次比赛“数字艺术/数字修饰照片”类别一等奖;抖音AI绘画特效使用人数已经超过2700万人。生成式AI的应用,极大提高了生产效率进而降低了内容生产的成本,也突破了部分技术壁垒,解放了各种限制,不仅在绘画中应用,也广泛应用于文本生成、音频生成、视频生成等领域,以丰富的数量和多元的形式满足数字时代用户对内容的需求。
—
图3美国科罗拉多州博览会的艺术比赛结果出炉,画作《太空歌剧院》荣获了第一名。消息一出,顿时在艺术届引起轩然大波,舆论一片哗然。不少艺术家公开质疑评比结果,因为这部获奖画作是利用AI工具创作而出。你怎么看?
文本生成是生成式AI最早应用的领域之一,在诗歌与小说创作、编辑出版、新闻稿撰写等方面均已有很多显性成果。如2017年5月,北京联合出版有限公司出版了AI诗人小冰创作的诗集《阳光失了玻璃窗》,集结了机器学习创作的139首作品。2018年网易有道推出的译著《极简区块链》,由AI翻译技术,几分钟就生成内容,效率非人所及。再如AI写书软件彩云小梦,可以根据用户所给出的一些基本的世界设定,围绕故事主题去进行联想创作。新闻稿撰写更是在全球范围广泛的应用,很多新闻机构使用AI生成稿件,尤其是在财经、体育等领域较多应用。早在2014年,《洛杉矶时报》的机器人就在地震发生的三分钟之后发表一篇报道。国内较早应用的是腾讯写稿机器人在2015年9月发出的财经类新闻稿件;2016年里约奥运会,今日头条机器人新闻,13天内,共撰写了457篇关于羽毛球、乒乓球、网球的消息简讯和赛事报道,每天30篇以上,其效率与准确度令人惊叹。此后,国内外多家主流媒体逐步采用了AI进行新闻稿撰写,提高新闻生产效率,满足新媒体时代用户速与量的追求。
—
图4
语音生成与交互也是生成式AI广泛应用形式之一。利用人工智能技术,将文本转化为语音,在新闻阅读、出行导航、视频配音等领域广泛应用。谷歌、微软、亚马逊、腾讯、阿里、百度、科大讯飞等均推出了相关平台,支持在不同场景下将文本高效率转化为语音。如科大讯飞在智能语音领域不断迭代创新,其曾为高德地图定制的林志玲、郭德纲的语音导航,一时引起无数追捧。其智能语音生成技术实现了对文字新闻的实时播报,并且声音流畅,一步实现了文本到语音的转化。国内基于科大讯飞语音云开发的此类应用不胜枚举,如搜狐新闻、一点资讯、荔枝新闻、凤凰电台等均有相关应用。
使用AI进行视频生成,虽然目前尚不成熟,但在视频编辑和生成中也有不少应用产生并逐步完善。如深氧科技的O3.xyz引擎就是一款能够一站式AI生成3D短视频的产品。终端用户通过文字输入,就能够快速得到自己想要的3D内容。再如由百度研究院孵化的 ,用户仅需一键输入新闻图文内容链接,就可以自动化完成视频制作,整套制作流程在数分钟内即可全部完成。字节跳动旗下的剪映和快手的云剪也都能够提供AI生成视频服务,以快手云剪为例,提供了智能封面、自动配音、自动字幕、画质增强、视频去抖、自动横屏转竖屏等系列智能工具,以技术赋能内容创作者。
随着技术的发展,生成式AI越来越多的能力接近甚至超越人类,在元宇宙等更新的领域,AIGC 的应用前景可能更为广阔,能够满足元宇宙中更多的 3D 人物和物品形象设计,不仅可以降低产出成本,也增加了产品的多样性。
PART 4
生成式AI所引发的内容领域变化
生成式AI的发展,与决策式AI相比,能够创作新的内容,改变了传统的媒体内容由人工生产的方式,带来的生产力的提升与突破。
生成式AI在内容生产领域的应用大幅度降低了创作的门槛,提高了生产效率,无论从价格、速度还是效果上都能达到降本增效的结果。因此被媒体和相关新媒体平台广泛应用。而这种内容生产模式的逐步普及所带来的直接影响是,用户可以根据自己的需求和框架,通过AI创作所需的内容,平台也将会迎来从精准提供符合用户需求的内容到提供符合用户需求的内容生产工具的挑战。
—
图5生成式AI的分发环节
▼
未来几年内容生产领域
将呈现以下发展趋势
一是数量方面,内容总量的激增。生成式AI的广泛应用,内容生产效率极大提升,普通用户均可以成为内容生产与创作者,生产效率和创作人数的同步增长将会带来内容总量的指数级增长。
二是质量方面,内容专业性的超越。目前生成式AI在文本生成方面的创作已经较为成熟,如在某些类型的新闻稿撰写上机器写作的效率已经远远已经超过了专业记者。随着技术的不断加持,从质量上来讲有赶超专业人员的趋势。
三是形式方面,交互性内容的增加。生成式AI的发展将大幅降低制作门槛,同时能够获得更好的用户体验,因此,技术准入门槛减低和用户需求旺盛的同步加持,将会带来交互性内容的多元。
以上几点发展变化,无不会引发相关领域平台将内容生产精力转向提高自身内容生产工具的研发和应用的发展趋势。
PART 5
热现象背后的冷思考
尽管随着技术的不断发展,生成式AI技术发展到能够替代部分专业生产者的阶段,或将为娱乐媒体领域带来颠覆性变革。技术驱动之下其对社会影响的层面、涉及深度均会增加,然而我们要辨认识到其存在的问题,避免盲目乐观或悲观。
▼
首先,我们需要意识到,以为代表的生成式AI技术只是一种工具,它并不能替代人类思维和创造力。虽然技术可以提供很多便利和效率,但它并不能代替人类的思考和判断能力。因此,我们应当看到在AIGC热潮下,以开放的心态积极拥抱、实现人机共生、协同发展。
二是,我们要关注人工智能所面临的数据、隐私风险以及道德伦理、法律等问题。如生成式AI可能被用于伪造虚假信息,或生成攻击代码、恶意软件代码、垃圾邮件等。以微软推出智能聊天机器人Tay为例,不到24小时就被网友教化变得出言不逊、脏话不断, 言语甚至涉及种族主义、充满歧视、偏见与仇恨,也因此Tay被迫下线。另一方面,用户在使用等AI工具时,不经意间将一些隐私数据输入到云端模型,这些数据可能成为训练数据,成为提供给他人答案的一部分, 从而导致数据泄露和合规风险。另外,也有生成式AI所引发的知识产权问题,机器生产内容的版权归属以及内容所引发的道德伦理问题,也成为当下迫切需要关注反思的问题,相关法律法规也亟待健全。
因此,我们在期待新技术给社会带来新的活力和变化,通过传媒领域创新应用为人们带来更多全新体验和新的可能的同时,我们也要保持理性和辩证思考,技术的快速迭代并不意味着其无所不能,也不要夸大技术驱动下的威胁。用其所长,避其所短,进一步规范使用,完善制度,在关注技术本身的同时,思考传媒行业如何面对这样的技术革新,探索有效的人机协作机制。
参考文献: