人工智能chatgpt发展的瓶颈是什么奇点来临：ChatGPT时代的机遇与挑战

默认分类2年前 (2023)发布 admin

1,058 0 0

1、引言

2023年新年伊始，风靡全球，朋友圈相关文章持续刷屏，中美股市相关公司股票也是全线飘红。其实我个人从去年11月底发布，就持续跟进关注，在我看来，的出现标志着强人工智能时代的来临，人类或许将会迎来Ray 所说的技术奇点（）。因此，认真研究，理解其中蕴含的机遇与挑战具有非常重要的意义。

近期恰逢好友孙继伟教授邀请我参加一个活动，分享这个话题的个人看法，虽明知力有不逮，但也斗胆一试。能力有限，错误难免，欢迎大家拍砖。我计划从如下几个问题来展开说明。

2、什么是？

从目前来看，大部分人对的理解是从产品层面，它是一个非常像人的聊天机器人（）。当然这里说的聊天指的不是语音聊天，而是通过文本互动，具体产品界面如下图所示。

与很多聊天机器人不同，追求的不是外形与人类接近，而是让你在聊天中感觉TA真的懂你。TA不仅知识渊博，对你提出的很多问题都可以给出答案（虽然这些答案未必是正确的），更重要的是TA说话的口气方式，非常流畅，完全摆脱了此前聊天机器人的僵硬和教条。根据我自己对的体验，感觉TA真的做到了像人一样聊天，甚至可以像人一样胡说八道（编故事），被指出错误后还会道歉。

而之所以能做到这一点，有赖于产品背后的算法模型，这其实也是的本来含义。按照给出的答案，这是一种由公司开发的自然语言处理 (NLP) 模型，用于实现对话生成和语言模型预测，通过分析对话历史和当前语境，生成合适的回复文本。在英文中“chat”是聊天的意思，GPT是一种预训练语言模型（ Pre- ）的缩写，其实就是基于GPT，然后利用人工微调升级的一个新语言模型。

GPT也在持续进化，最新到了3.5版本，GPT-3.5的相关数据并未被公开。从GPT-3公开信息来看，整个神经网络就已经有1750亿个参数。而要对这么多参数进行训练，所需要的数据和算力都是惊人的。

先说数据，GPT和其他大语言模型的数据来源大致包括如下六类，分别是：维基百科、书籍、期刊、链接、 Crawl和其他数据集。根据发布的关于GPT-3模型论文，训练数据集来源、文件大小（GB）和token数量（单位是）如下图所示其中所有合计数据集容量为753GB，包含4990亿Token（0.7字节/Token）。

资料来源：“数据集之谜”， Alan D.

再说算力，据报道，GPT3.5 的训练使用了微软专门建设的 AI 计算系统，由 1 万个 V100 GPU 组成的高性能网络集群。而训练模型的总算力消耗约为-days（即假如每秒计算一千万亿次，需要计算3640天），需要7~8个投资规模30亿、算力500P的数据中心才能支撑运行。注意，这还只是模型训练阶段的算力需求，如果考虑真实运行过程中的算力需求还会更为惊人。

总之一句话，是大力出奇迹的典型案例，是芯片、显卡、云计算、数据库等多种技术发展到一定阶段，发挥协同效应的产物，是从弱人工智能走向强人工智能的里程碑！

3、谁创造了？

如此强大，那么又是何方神圣创造了TA呢？

这家公司就是名不见经传的。

是一家在美国成立的通用人工智能研究公司。公司核心宗旨在于“实现安全的通用人工智能(AGI)，使其有益于人类”。该公司现在已经是全球最著名的人工智能研究机构之一，发布了许多著名的人工智能技术成果，包括GPT系列大语言模型、DALL·E系列文本生成图片预训练模型、系列语音识别模型等。

2015年，特斯拉创始人埃隆·马斯克和硅谷著名孵化器YC的前总裁萨姆·阿尔特曼（Sam ）等6人共出资10亿美金，在旧金山创建了一个非盈利性人工智能公司也就是最初的（ Inc.）。那时其目标就是为了和其他研究机构合作，进行AI的相关研究，开放各自的研究成果共同促进AI技术的发展。这个“开放”的态度一直持续到GPT-2模型推出并带来的巨大成果后，认为GPT-2模型效果太好了，很可能被人用来进行不好的事物，便在此之后限制了研究成果的外放。2018年2月，马斯克离开了，投身于，而萨姆在这个时候宣布自己和YC再无干系，出任的CEO。

两位创始人& Musk

如之前所分析，是大力出奇迹，但一家非盈利机构要持续有大力，显然仅靠捐助难度巨大。于是，2019年，先是Reid （联合创始人）和（一家专注于信息科技领域的投资公司）向投资了一笔不知数额的资金。随后，宣布成立 LP，专门用于对外融资。

至此，正式从非盈利性研究机构变为半盈利性机构。其核心机制是，在确保机构总体发展方向与使命不变的状况下，设定“有限盈利”（-）架构。公司规定，投资者的回报不能超过投资金额的 100 倍，为投资机构和员工创造具有“利润上限”的价值。之后，微软投资10亿美元，两者宣布将共同打造Azure AI超级计算技术，同时的服务也全面转移至Azure云上，打造商业化的基础，共同构建具有经济价值的AGI（通用人工智能）。

最近，微软再次追加投资100亿美元，占 LP 49%股份。根据《财富》杂志看到的文件显示，在新投资完成后，在的第一批投资者收回初始资本后，微软将有权获得 75% 的利润，直到它收回其投资的 130 亿美元，这一数字包括之前对的 20 亿美元投资。双方约定，直到赚取 920 亿美元的利润后，微软的份额将降至 49%。与此同时，其他风险投资者和的员工也将有权获得 49% 的利润，直到他们赚取约 1500 亿美元。如果达到这些上限，微软和其他投资者的股份将归还给的非营利基金会。看起来复杂的融资条款的背后，实质上就是微软无息借钱给，并以 LP的股权为质，借多久取决于赚钱的速度。

表面看，这笔交易微软吃了亏，但实际上，这笔巨额投资转手又被购买了微软Azure云计算服务。而且通过绑定，微软不仅可以优化BING，为打破搜索垄断积蓄了力量，同时的API也经由Azure分销，对其销售必将产生巨大的拉动。打不过就加入！巨头微软能有如此灵活的身段，看来在强人工智能时代它仍然会有一席之地！

不难看出，虽然名不见经传，但是其创始人和投资人或是硅谷精英，或是行业巨头，虽然至今TA仍在亏损烧钱，但未来不可限量！

4、的能与不能？

人工智能chatgpt发展的瓶颈是什么奇点来临：ChatGPT时代的机遇与挑战

要理解的能与不能，我们需要从知识的视角去认识它。纵观人类发展，人类发展史也是一部知识发展史，是人类不断创造、传承、利用各种知识去解决各种问题的过程。为了让知识创造、传播和利用的效率提高，我们会发明各种工具。比如，为了能够将毕生的经验传递给下一代，我们创造了语言；为了更远范围的人们可以获得知识，文字应运而生；为了拉长知识传播的历史深度，泥字版和印刷术被发明。不难理解，凡是能够促进知识创造、传播和利用效率的发明几乎都是人类重大发明，也必将对人类的发展产生深远影响。

上世纪，人类进入互联网时代，全球范围内的人际沟通交流极度便利。存量知识流通开始加速的同时，新知识也被更快地创造出来。人类知识的传播与储存也进入了指数级的增长阶段，我们每天产生的信息量以ZB（泽字节，十万亿亿字节）计量。搜索引擎成为互联网时代提高知识探索与发现效率的重要工具，因此横空出世，成为这个时代的霸主。

搜索引擎能够让人用双手在网络上高效探索知识，但人机互动模式总体还是传统的，主要靠关键词检索而非提问。但事实上搜索同一个关键词的用户，他们的目的并不相同，所需要的信息与知识也可能差异巨大。再考虑互联网日益增多的垃圾信息，搜索引擎能为用户带来的精准信息和知识服务的价值正逐步弱化。的出现或许会极大程度改变这些问题。

通过自然语言处理技术，基于人类历史上所有以文字承载的信息，集结了人类的大部分智慧，并且可以将知识进行整理、凝练、归纳，最终条理清晰地以文字呈现。相较于搜索引擎，它可以回答十分笼统、宽泛的概念问题，也可以依靠提问的方式，帮助提问者逐步细化问题并解决问题。能够让我们每一个普通人站在人类历史上曾经所有有文字记录的哪些巨人的肩膀上，更高效的创造新知识，因此必将促进人类知识生产效率的极大提高。

那么主要可以扮演哪些角色来帮助我们呢？个人以为，的优势在于能像人一样处理信息，即根据实际需要将问题简化并把握重点，而且它具有流畅自然写作的能力，能够准确地表达信息。基于告知用户信息、启发用户联想、帮助用户写作的作用，其优势特点可以用“百事通、点子王和笔杆子”三个关键词来归纳。自然的对话方式超越了搜索引擎的关键词抓取形式，使人机互动更加高效便利，带来人机互动新模式，进而让知识传递、获取和创造更加高效。

大哲学家维特根斯坦说过，语言就是世界。因为语言是我们表达世界观的重要工具，也会塑造我们对世界的看法。出现，破解了人类自然语言密码，直接促进了人机交流效率，间接促进了人际交流效率，必将对人类知识增长带来助力，或许会让人类拥有全新的世界观。

但是，人无完人，机无完机，目前仍存在五大局限：

一是，“聊天”本质是词语频率推断，而非理解，因此难免有错，不可全信；

二是，其训练信息存在滞后性，难以反映各领域的最新信息；

三是，以通用知识为主，缺乏专业领域知识，诸多专业领域暂时无法深入，而且很多回答很可能是编造的，绕能够误导用户；

四是，缺乏现场知识，无法给出决策建议；

五是，受限于提问者的提问能力，缺乏主动性，还做不到像人一样主动引导和服务客户的能力。

5、未来如何发展？

关于未来的发展，我们可以从产品、公司和产业三个层面进行思考。

首先，从产品发展的层面看，目前是一个界面非常简单的聊天机器人，使用起来并不好用。创始人也说这个产品很粗糙，并不是一个好产品。其实公司还提供API接口，为其他需要聊天服务功能的其他公司提供支持。API或许才是的重要产品形态，我们今天看到的聊天机器人很可能只是展示公司算法实力过渡性工具。（注：几天前宣布推出）

畅想AIGC时代的产品形态，一方面的算法模型可以通过提供API的方式嵌入各种场景之中，进而成为各个行业的专家，例如投资顾问、家庭医生、专职教师。从问世的当周，中涌现出的微信聊天机器人、代码纠错助手、PPT自动生成器等各种产品中，我们就可见一斑。此外，语音文字图像视频代码等多模态AI也可以进行融合，像我们当前部分AIGC产品实现的“看图说话”功能，也许在未来，我们也可以实现根据文字生成演示视频、根据网页图片生成代码等。

其次，从公司发展层面看。可以预见，公司将持有更开放、更低价、更智能和更深入的发展理念。（注：本演讲之后不久就已经发生了API费用下降和.0的推出。）做一个预测，未来会全面开放，但是同时很可能会通过收购把一些专业领域的数据公司纳入囊中，比如医疗、金融，毕竟通过这些可收费的领域知识服务远比收取语言模型更让人可以接受。

最后，延伸到行业层面，AIGC产业的崛起将会重塑现行内容产业。未来,今天我们熟悉的聊天机器人意义上的或许会消失，甚至公司也没了，但或许成为AIGC产业的代名词，而不是某一家公司的产品。在芯片算力、算法模型和新能源产业极有可能呈现高度集中的发展态势，出现行业巨头。前两个很好理解，可为什么新能源产业也会出现巨头呢？我认为，智能计算除了需要前两个要素，巨大的能量消耗也不可避免，智能时代对新能源提出了新的需求。能源问题将是智能时代的卡脖子产业。这一点可以从非常关注受控核聚变就可以体会的到。

总结下，最大的优势是让机器更像人，让人机互动方式更加自然、简单。或许会成为人机交互的新型基础设施，一端的操作系统链接软硬件，另一端通过浏览器和搜索引擎链接用户。以自然语言的方式将用户的诉求细化，进而更精准地搜寻适合的内容进行呈现。自然语言会成为未来互联网的主交互界面，类似谷歌的搜索垄断也将在人机链接上再现。

6、时代的机遇与挑战？

时代充满了机遇与挑战。但对不同性质的岗位、不同类型的公司影响并不相同。

对于个人而言，新技术解放了人类繁杂重复工作，让人将宝贵的时间精力转移到更多具有创造性、想象力和人性化的工作岗位，人均生产效率会持续提高。当然，一部分岗位将容易被替代，如从事简单且重复性强工作的人员（客服、柜员等）、浅创意工作人员（文案设计师、平面设计师、初级编程人员、记者等）、还有风险低、责任小的工作人员（文员、设计师等）。但是，机器替代的不是人类这个整体，而是人类中不善于学习进化的一类人，它不是替代我们，而是促使我们更好地进化，为我们赋能。可以预料，与以往一样，新技术势必将会拉大人与人之间的在知识、财富上的差距， AI时代的人际、国际冲突或许会增强。但同时，我们也应该保有乐观，只要本着合作共赢、友善互助之原则，人类一定能在AI时代迎来新的秩序。

对于企业而言，新技术将降低人工成本，便利企业与客户互动交流，为企业发展提供技术驱动力，因此，总体上机遇大于挑战。但不同类型的企业所受影响各不相同。比如应用工具类如和苹果，我觉得对他们更加友好，因为这些新技术可以改善他们的服务。想象下，的智能客服24小时为客户耐心服务的场景。而内容类企业如和迪士尼，由于AIGC能力大幅提升，虽然可以改进在位者的工作效率，但是也可能让内容产业发生颠覆性变化。对于这些企业，如果可以以积极的态度拥抱AI，能更快寻找到新的动力源泉，机遇大于挑战。而科技类企业的未来发展差异较大，有些会很快迎来发展新机遇，比如，因为直接诱发对算力的巨大需求；有些则会被彻底颠覆，比如。但不管如何，与时俱进，拥抱AI才是王道！

（作者巫景飞为上海大学经济学院副教授）

内容源自巫景飞个人公众号“商业知行侠”