图片来源@视觉中国
文|
的企业应用是企业界、法律界高度关注的领域。尽管Open AI还没有对中国用户开放服务,其企业版 仍在研发中,中国的跨境电商作为早起的鸟儿,已经开始应用的路上。
根据《互联网法律评论》特约专家、金杜律师事务所合伙人冯晓鹏律师团队的实地调研,已开始在跨境电商行业应用,在制作图片、视频、PPT、翻译等环节上更是大放异彩。
通过调研,冯晓鹏律师及其团队成员分析了跨境电商应用的五个热门场景以及面临的三重风险,并指出,正在重塑、洗牌跨境电商行业,跨境电商企业应当在“热”下保持冷思考,主动拥抱合规,充分发挥的最大价值。
自去年11月问世以来,就以更高的智能程度、更宽广的领域知识、更灵活的响应能力、更自然的对话语境以及更瞩目的迭代速度使整个互联网都受到极大冲击。近日,公司公布消息,企业版 将在未来数月推出,这无疑将再推上高潮。卡尔·萨根称,人类由群星所铸,如今眺望群星。与人类的对话,让群星更为闪耀,也带来更多未知。
团队近期到部分跨境电商企业客户实地调研发现,已开始在跨境电商行业应用,在制作图片、视频、PPT、翻译等环节上更是大放异彩。
跨境电商作为互联网交易的典型代表,其基于“跨境交易”“在线订单”及“跨境物流”的属性,对跨境快速信息传输技术、语言翻译交流、在线宣传销售等工作相较于国内电商有更高要求,而的出现缓解了跨境电商自身能力的发展痛点。处于人工智能奇点的前夜,本文拟结合实地调研的情况,综合分析在跨境电商行业的应用,以及以数据出境、数据安全保护、知识产权等视角分析跨境电商在应用时应注意的合规风险以及合规建议,企求协助跨境电商企业在新技术的发展与合规的天平上取得平衡。
为何 能做到“人机互卷”?
可以被看作是一种通用的语言理解器,它可以根据输入文本的上下文和意义来生成输出。能不断接近人类,带来“人机互卷”的背后,涌现能力、思维链、人类反馈强化学习技术起关键作用。
在大型语言模型(LLM)中,涌现能力( )是指模型具有从原始训练数据中自动学习并发现新的、更高层次的特征和模式的能力。[1]多模态大语言模型(Multi-modal Large Model,MLLM)在大型语言模型的基础上可实现更好的常识推理性能,跨模态迁移更有利于知识获取,加速了能力的涌现。这些独立模态或跨模态新特征、能力或模式通常不是通过目的明确的编程或训练获得的,而是模型在大量多模态数据中自然而然地学习到的,类似于“量变引起质变”。
思维链(Chain of )是和GPT-4能让大众感觉到语言模型“像人”的关键特性。[2]通过多模态思维链技术,GPT-4将一个多步骤的问题分解为可以单独解决的中间步骤。在解决多步骤推理问题时,模型生成的思维链会模仿人类思维过程。
人类反馈强化学习技术( from Human ,RLHF)的训练加入,GPT-4能输出高质量回答,确保模型输出对人类有益,进而保证模型的安全性,RLHF也是保持多轮对话不偏离主题的关键保障。[3]
总的来说,自2018年6月GPT-1发布,GPT家族在历代的模型训练中通过不断优化的训练方式和训练数据解决自然语言处理中的问题,从而使得最新代的GPT-4支持图像和文字两类信息的同时输入,并且拥有更好的逻辑推理能力。基于上述特性,已经能与跨境电商的多个业务场景紧密结合并切实应用,助力企业以更低成本快速拓展市场。
在跨境电商的应用场景
目前已有跨境电商企业、跨境电商服务商试水。根据某跨境电商上市企业对深圳证券交易所关注函的回复[4],公司已结合跨境电商业务模式和IT技术储备,借助公司开发的技术赋能包括选品、素材制作、广告投放、翻译、客服等业务节点,已累计帮助公司上新品1W+、累计节省客服1000人次工时、生成新广告文案7W+、处理图像素材2W+。
在跨境电商领域的应用场景包括:
1. 客服咨询
与日常生活中使用的各类智能音箱不同,具有以下特征:(1)可以主动承认自身错误。若用户指出其错误,模型会听取意见并优化答案。(2)可以质疑不正确的问题。(3)可以承认自身的无知,承认对专业技术的不了解。(4)支持多轮对话。在对话过程中会记忆用户的对话内容,即上下文理解,以回答某些假设性的问题。因此,跨境电商商家可以利用为境外不同语言文化下的消费者提供无语言障碍的客服咨询服务,比起聘请并培训相关语言专业人才,响应更加快捷且成本低。
2. 产品分析
基于的检索功能,目前已有境外跨境电商服务商开发插件工具包,跨境电商出海企业只要下载该软件后打开亚马逊找到对应商品,就可以通过从产品评论中一键分析购买动机、产品优缺点、客户期望、使用场景以及构建用户画像等内容,实现对该商品的消费者分析,并会为该商品提供针对性的修改建议。的海量数据输入与输出将为跨境电商企业节省高昂成本的市场调研投入,以便企业快速找准商机,开拓市场。
3. 内容创作
跨境电商出海企业可以通过向输入要求和关键词,快速生成产品标题和产品的具体描述,例如“我在美国亚马逊上卖水杯,请用英文写一段关于黑色水杯的详情页商品介绍文案”,或者可以通过草拟邮件、邀请函,例如“我是跨境电商宠物产品卖家,销往美国、澳大利亚等国,请用英文写一封第133届广交会的邀请函”。强大的文案输出功能将为跨境电商企业上架新品、与平台沟通等提供更多便利。
4. 协助生成图画、视频
跨境电商企业可以向输入视频脚本要求“今年是我的跨境电商企业成立的十周年,请生成一个市场推广视频的文案”,随后将输出的内容导入视频制作软件自动生成视频。跨境电商企业也可通过生成文字要求,导入AI画图软件,利用二者的人工智能技术,快速生成各类宣传海报及产品展示图案。制作时间从“以天计算”直接升级为“以分钟计算”。
5. 低代码编程
可以用自然语言实现低代码编程,包括但不限于、、Java、C#等。可以根据提供的代码片段和问题描述,分析可能的问题原因,然后提供相应的解决方案。此外,还可以提供编程建议、最佳实践和代码优化技巧,以帮助开发者提供代码质量和性能,这将有助跨境电商企业通过低代码编程技术自行建立独立站,也将推动跨境电商企业进一步升级ERP系统及申报系统,降低因系统错误而产生的跨境申报责任。
长期来看,有望成为浏览、搜索、信息汇总的终端。据官网,目前在和的交互对话框中,可以索引外部网页、绘图、撰写代码、访问用户的文档、使用插件链接外部App功能,结合GPT-4的多模态能力,可以进行图片的输入和输出,若未来以视频作为训练材料,甚至还可能直接理解和生成视频,以目前展现出来的能力,它有望成为以个人需求出发的信息交互终端。
已经可以基于插件在推荐后引导用户形成购买操作。目前,已经拥有插件功能,从官网放出的demo来看,聚合了多个App插件的可以连接多个垂直领域的App功能和数据,一站式生成所需要的内容,并且可以将其推荐的产品直接勾选后等待用户一键加入购物车下单。例如,用户可以向GPT发问:“今天想吃有机蔬菜,请推荐1-2个菜谱并提供购买渠道”,GPT可向用户发送购买链接。
一旦类GPT应用可以在国内广泛运用,除给跨境电商企业本身工作效率带来质的提升,还将有可能改变旧的跨境电商消费搜索方式。过去的流量是以站点为中心,头部跨境电商平台都基于电商用户的使用习惯拥有自己的流量池,初创平台则鲜有人关注。而未来若流量中心迁移至类应用,那么整体的流量分配逻辑将迎来变革,从平台为中心转移到以用户需求为中心,更有助于在跨境电商领域实现“百花齐放”,促进跨境电商外贸高质量加速发展。
中国跨境电商企业使用的合规风险
1. 虚拟专用网络使用与通过第三方接入的风险
值得关注的是,目前并未向中国用户开放,国内用户需要使用虚拟专用网络(VPN)通过国外IP地址才能访问体验相关服务。而根据《计算机信息网络国际联网管理暂行规定》第六条、第十条及《工业和信息化部关于清理规范互联网网络接入服务市场的通知》规定,任何单位和个人不得自行建立或者使用其他信道进行国际联网,未经电信主管部门批准,个人、法人和其他组织不得自行建立或租用专线(含虚拟专用网络VPN)等其他信道开展跨境经营活动。如果境内跨境电商企业通过没有经过合法许可的国外网络服务来使用,产生规模效应并被网信部门关注的,将可能因违反我国《计算机信息网络国际联网管理暂行规定》第十四条规定而承担法律责任,包括由公安机关责令停止联网,给予警告,可以并处15000元以下的罚款;有违法所得的,没收违法所得;构成犯罪的,将依法追究刑事责任。
据了解,目前已有跨境电商企业与使用接口的国内第三方合作开发小程序,使得国内客户可直接通过小程序使用。该“转接”行为向不特定用户提供能使他人访问国内IP所不能访问的境外网站的服务,如果该合作方式所使用的国际联网通道本身存在违规风险,则向国内客户提供此类服务的跨境电商企业也可能面临违反我国《计算机信息网络国际联网管理暂行规定》的合规风险。
2. 数据安全、个人信息保护与数据出境安全风险
用户在使用时输入的文本将会被存储在开发者或使用的云服务提供商的数据中心。在人机交互问答中,提问者与分享的隐私和个人信息、商业秘密等数据可能被用于未来模型的迭代训练。在这一个过程中,中国公民或企业使用便是以数据的出境与入境作为服务的开端和结尾,都存在着数据跨境流动安全风险,如用户提问时可能涉及到个人信息、敏感信息甚至有关国家安全、经济运行、社会稳定、公共健康和安全的重要数据。
尽管基于各国对于数据安全的的担忧,已于4月23日在官网中明确引入了“关闭聊天记录”的功能,禁用聊天记录时启动的对话不会用于训练和改进模型,并且该对话仅保留30天后将永久删除,但是出于国内监管部门对境外网站监管的有限性,跨境电商企业在直接使用或利用其对境内主体提供服务、甚至是直接向境内主体开放端口时,仍然无法完全避免隐私数据进入对话,故应特别关注数据安全与隐私风险,从源头输入加以控制。
3. 著作权侵权风险
是基于使用多层“变化器”()架构的语言模型,其依靠巨量的文本数据进行训练并通过监督学习、强化学习以优化输出内容。相关文本数据包括历史、科学、文化、技术等方面,其来源于不同的渠道,在训练过程中需要对数据进行复制、挖掘、学习。但相关数据中的作品并非全部处于公有领域,也并非均获得了权利人的授权。仅从我国著作权法相关法律法规来看,由于该等使用行为尚不属于《中华人民共和国著作权法》中合理使用的情形,如用于获取学习的作品未经公开授权,则其基于此输出的内容将存在侵害著作权的法律风险。
在上述跨境电商行业具体应用场景下,所生成的文本内容有可能与他人在先作品存在较高相似度,甚至有可能构成实质性相似,从而导致相关著作权侵权诉讼。根据在平台《使用协议》第3(a)条明确约定,“您可以向服务提供输入,并接收服务根据输入产生和返回的输出。输入和输出统称为‘内容’。在双方之间以及在适用法律允许的范围内,您拥有所有输入内容,并且在您遵守本条款的前提下,特此向您转让其对输出内容的所有权利、所有权和利益。可在必要时使用内容以提供和维护服务、遵守适用法律和执行我们的政策。您对内容负责,包括确保其不违反任何适用法律或本条款。”虽然是文本的输出主体,但该输出并不具有创造性,同时也并非人类作为创作主体,因此该内容的使用者,即跨境电商企业应当对使用时输入输出的整体内容负责,包括承担相应的著作权侵权责任。如果同类竞争企业在上输入了相同的问题,获得了相同的输出,那么是否存在著作权侵权之争呢?同样的宣传文案是否会引发不正当竞争呢?这也将是带给跨境电商企业进一步思考和探讨的合规问题。
跨境电商企业使用的合规思考
在极大解放跨境电商企业的生产力的同时,也带来了更新的法律问题和合规风险,跨境电商企业应关注其可能潜在的法律风险、注意强化自身合规建设。
1. 对的获取、使用来源及路径进行充分调查,关注政策变化
为确保的使用来源并非违规联网,我们建议跨境电商企业应首先对合作的联网主体或提供的API接口的第三方进行充分的尽职调查,包括但不限于经营资质、账户信息、合作方及对外开放端口等,避免因合作方违规原因导致账号封禁带来的数据损失。同时,及时关注并审慎对待在中国市场的应用与监管要求,如未来监管明确限制的适用范围,跨境电商企业应及时评估合规风险,调整使用策略。
2. 建立针对使用的内外部风险防控机制及保密机制
为了保护数据安全及个人信息安全,高效但低风险地推进工作,建议跨境电商企业应在内部设置完善风险防控机制及保密机制,针对使用的范围及特点,设置专项管理制度,对关键敏感部门(如售后服务部门、财务部门、技术部门等)限定对话输入内容范围,严令禁止输入公司商业机密、个人隐私等内容,并将员工数据进行内部留存、定期审核。跨境电商企业还应内部强化信息安全与保密培训,通过电子邮件等公告方式定期提醒公司员工的保密义务,明确应保密的具体对象,及时更新企业管理制度,完善公司的商业秘密及隐私数据保护体系。
如跨境电商企业将相关小程序直接开放给客户使用,建议跨境电商企业在《用户协议》、界面明显地方标注出客户在使用时的注意事项,例如输出内容不得含有《全国人民代表大会常务委员会关于维护互联网安全的决定》、《中华人民共和国电信条例》、《互联网信息服务管理办法》等规定禁止的信息,尽到审慎注意义务及风险提示义务。
3. 对于输出内容的使用应注重知识产权保护及其他主体责任
尽管在形式上系内容输出的主体,但其归根到底也仅仅是一项工具,跨境电商企业在尝试通过实现创新增长的过程中,也应时刻警惕其可能产生的法律风险以及其本身无法承担法律责任的客观事实,跨境电商企业作为使用主体,仍需对每一条输出内容承担法律责任。因此,避免对此类工具过度依赖,如何在法律规制的范围内合理利用,是跨境电商企业应当尽快关注的重点。例如,在知识产权保护领域,跨境电商企业对基于输出生成的宣传文案、图片、视频、产品设计等成果文件,仍应进行充分的知识产权调查,核实是否存在对已有知识产权权利人侵权的风险;此外,对于非特殊背景设定提问下产出的内容,应当关注是否存在同质化竞争的商业风险,以及如果在此基础上通过人工调整产生了新的创造,应当及时通过注册备案等途径进行知识产权保护。
结语
被誉为“是通用人工智能发展的奇点和强人工智能即将到来的拐点,并将标志着一场超越互联网的产业革命的到来”。跨境电商领域也正积极应用等类AIGC的应用。当跨境电商从业者震撼于的高效便捷时,也正重塑、洗牌跨境电商行业。跨境电商企业应当在“热”下保持冷思考,主动拥抱合规,充分发挥的最大价值。