近几年,中国、日本、英国、欧美等国先后将人工智能(AI)确定为国家战略,对AI的资金投入逐年攀升,以此提升国家竞争力。中国也早在3年前就加入了AI创始国行列。至今中国已成为全球范围内AI研究领域最大的参与者。
作为消费者,我们的日常生活已经被AI包围,每天都在接触着AI。通过地图软件了解如何避开交通堵塞、找到去办公室的最近路线;过滤掉垃圾邮件;在网站上像机器人一样提问;得到音乐上的建议;得到工作上的建议;了解其他消费者都做了什么,等等。这些交互信息帮助我们从与系统的互动中找到答案。与此同时,AI技术在出版业也有愈来愈广泛的应用,为企业和用户提供更多的应用场景。
英国出版商协会在去年11月~今年3月间对130多位会员进行电话访谈及线上问卷调查后,近日发布了名为《AI在出版业的作用》的分析报告。报告称,AI目前被应用于学术、教育和大众出版商的整个价值链,来帮助企业提高IP版权保护水平、内容可见性及市场预测和其他策略分析能力,帮助用户进行常规搜索和分析性总结,由此生成新的市场洞察。AI技术还可以节省研究人员、作者、老师和消费者的精力,专注于做有附加值或创新的事情。
该报告显示,英国大多数出版商从2017年开始对AI技术进行投资,在出版社内部成立小型AI研究团队(其中有一半的出版社将AI业务团队设在英国本土),或者与AI技术公司和大学研究人员共同合作进行AI的研发应用。大型出版商使用AI技术来获取并开发新内容,有3/4的大型出版商已经或准备在2年内将AI技术用于营销和销售环节。
出版商认为,AI会对出版商的竞争环境带来巨大影响,有2/3的出版商预计未来将与不同类型的出版机构展开竞争。大多数已经应用AI技术的出版商都意识到AI投资的益处。从不同领域看,学术出版商可以运用AI技术支持科研成果的分享、发现相关同行评议人并对研究成果进行核实,帮助研究人员进行论文查重、侵权筛查,并为高质量的科研提供高质量的可见数据。
学术出版商将是AI技术的最大受益者。教育出版商运用AI技术开发教育内容,可以为学生提供更好的学业分析及个性化学习解决方案,让教师有更多时间用在学生身上。在大众出版领域,AI技术可以生成消费者内容,可以帮助作家节省日常调研时间、增加作家创作产量,出版商很快将开始营销AI生成的小说。但AI技术生成内容的版权如何归属和判定,需要对版权保护法相关细则作出明确的法律界定,为出版商购买作品版权创建稳固的投资环境。
AI在出版业主要应用机器学习(ML)、深度学习(DL)、自然语言处理(NLP)、语言识别及计算机视觉技术。AI技术可以帮助出版商对内容进行分类,如使用元数据标记,将图文识别技术与ML和DL技术整合起来,并结合搜索引擎来改善内容可见性;可以帮助出版商发现市场趋势,改善企业经营效率、成本结构以及用户体验,并为平台的推荐服务提供支持。所有大型出版社在接受调查时均表示,将在2年内使用AI技术对内容进行分类。
该报告指出,为增加出版商对AI的投资水平并给消费者带来更多利益,必须克服许多投资障碍,如缺少AI技术人才,难以将AI解决方案用于原有基础设施及整合不同部门。对小型出版社来说,困难在于中前期阶段要为AI研究和实施支付大量的投资成本。
因此,报告建议英国政府及业界提高对AI投资关键问题的认识,完善相关政策,共同推动AI应用及其他解决方案的实施。提出的主要建议包括:进一步完善版权保护法,促进出版商与关注AI的中小企业和学者之间的合作,帮助中小出版社在金融和技术方面得到AI技术的支持。该报告建议政府应通过设立挑战基金( Funds)的方式,支持并鼓励学者和技术型中小企业共同参与到AI技术应用创新中来。
英国出版商协会主席兼泰勒与弗朗西斯CEO安妮·卡兰南(Annie )认为:“数字解决方案在整个疫情期间让我们受益良多,技术的发展使虚拟活动得以实现。技术让身处各地的我们连在一起。我们运用技术产生了显著结果,同时,我们也要问自己,技术能实现什么?随着出版商对技术应用的不断创新,我们可以信任法律来解决问题吗?”她强调指出,AI技术不是要替代人类,而是解放人类,让人类更有创造性,能够探索新的研究领域并改变教育的方式。
英国出版商协会AI办公室数据负责人克莱尔·查普曼( )表示,掌握AI技术是目前中小企业面临的困境,英国政府已向16个中心投资1亿英镑用于技术培训,另外投资5000万英镑吸引AI顶级技术人才。她透露,政府将开设商务投资主题的AI研究生课程,发布2500个AI和数据科学的学位转换课程,将面向1000位课程学员颁发奖学金,来吸引更多人参与AI的学习。该协会知识产权办公室负责人罗斯·林奇(Ros Lynch)表示,该部门将督促出版商积极运用AI技术,并提供对AI应用的分析。
我们选取了9月在京举办的第12届中国图书馆馆长与国际出版社高层对话论坛及英国出版商协会的《AI在出版业的作用》分析报告中的5个案例,来阐释AI技术在出版业的广泛应用。
AI技术实现智能推荐释放科研活力
爱思唯尔产品副总裁罗斯·惠里尔(Rose L’)以平台(以下简称SD平台)为例,介绍了该公司如何运用AI技术,帮助研究人员进行科研并促进科学发展。
她表示,在信息泛滥的时代,研究人员处理大量数据是极其困难的。他们期待有足够的工具构建和解释海量信息。同时,研究人员做学术研究时发现,研究变得越来越跨学科。很多未知的术语正在被使用,而研究人员通常需要更多的信息来源。此外,研究人员在搜索和阅读文章的过程中浪费了大量时间。
爱思唯尔在一年多前,通过使用机器学习(ML)和自然语言处理(NLP)技术,并借助关键词共现来构建AI领域,探究在这个领域使用了哪些不同的技术。惠里尔以两个例子来说明SD平台上如何运用AI来帮助研究人员开展科研工作。
一个案例是运用AI技术创建SD主题页。她指出,主题页就像一个科学的维基百科网站,用户通过它可以找到关于特定主题的基本信息。研究人员可能会遇到一些具体问题,如浏览一项科学研究时,遇到了一个不理解或不熟悉的领域中的专业术语,想更多地了解它。这时,研究人员可以通过点击由AI完成的链接进入主题页。研究人员也可能希望搜索某一领域的更多信息,SD制作一个可以被搜索引擎发现的主题页,便于研究人员通过搜索引擎找到这些专业术语的可靠来源。
通过建立主题页可以使用户快速了解某个概念的相关信息。在主题页面上显示主题名称、从书中摘取的对该主题的简要描述,以及从一些图书或文章中选取的与主题相关的信息片段及其他主题页面上的相关链接,来帮助读者了解与该主题相关的基础知识。这样的主题页面完全是借助AI技术自动生成的。这些技术已经运用到所有主题领域,目前SD平台上有30万个主题页,每月有近两千万次的访问量。
在运用AI技术生成主题页时,首先通过不同领域使用的15种分类法来确认哪些概念是希望建立的主题页。然后利用数据挖掘技术来运行分类法,选出想要使用的章节和文章,并生成主题页。之后再运用NLP技术选择相关信息片段。
NLP技术可以帮助我们确定哪些文章内容与该主题最相关,以及应选取多大的信息片段。有了一些信息片段后,我们就要确定哪个信息片段要优先展示,使用相关性排名运算技术会有助于揭示相关性最高的信息片段。最后一步是在整个过程中加入一些人工干预,以保证数据质量。
她指出,需要从学科专家那里获取反馈意见以确保质量。在这个过程中可能会有一些主题是关于其他学科的,对此要进行特别处理。除此之外,主题页会进行自我纠错。ML模型使得数据质量不断提升并且持续了解用户浏览的信息片段,积累数据分析的信息。
另一个案例是运用AI技术提供推荐服务。推荐服务可以预测用户是否喜欢一篇文章,以及这篇文章是否与用户相关。SD的推荐服务可以帮助读者减少搜索文章的时间,提高阅读文章的相关性,并且提供人工搜索难以找到的答案。在推荐服务的帮助下,爱思唯尔帮助研究人员找到了通过其他方式找不到的文章。