基于chatgpt模型的免费ai软件以ChatGPT为代表的“大模型”会是多大的技术革命？

默认分类2年前 (2023)发布 admin

4,542 0 0

最近，比尔盖茨在回答网友提问。有人问当下‘巨大的技术变革’是什么时，他回答说：

‘AI 是个大人物。我不认为 Web3 有那么大，或者元宇宙本身的东西是革命性的，但 AI 是相当革命性的。’（翻译）

‘AI 是重要的。我不认为 Web3 那么重要或者说单独的元界是革命性的，但 AI 是相当革命性的。’（翻译）

能和盖茨在 Web3 和人工智能的判断上一致，让我很开心。

另一件事，发生在朋友圈里。网易副总裁、杭州研究院执行院长汪源在讨论微软加大投资能否赚钱时，说到：

这句话透露了两个信息：1．网易杭研在大面积尝试应用的能力；2．为此要付不少服务费，但也愿意。

在网易工作过的都知道，要做一件对外付很多钱的事情，那一定是下了很大决心的

可是，就在两个月前，还没有发布的日子，业界对 AI 其实是悲观的。

L4 级自动驾驶被证明太难做到了，很多公司开始放弃。我有一个在头部公司做核心算法的朋友，已经选择转行了。

AI 四小龙也风头不再，探索出的业务模式变成外包项目为主，且技术含量越来越低。

为什么一推出，会带来 180° 的态度变化？

这两个月，我和对话数百条，参加了三场相关的研讨会，与十几位学术界、企业界的专家交流，当然也读了很多资料，对以下问题形成了一些观察和思考。

与以往的 AI 不同在哪里？它为什么有可能成为通用人工智能？

通用人工智能对信息技术行业最直接的冲击是什么？

商业机会在哪里？

行业格局会怎样？

个人职业发展会受到什么影响？

下面就谈一下我的观点，期待你的批评指正。

一、‘大模型’敲开了通用人工智能的大门

用的方法叫‘大型语言模型（Large ）’，简称 LLMs。中文习惯称为‘大模型’。

简单说，它的思路就是把尽可能大量大量大量大量的数据通过架构做机器学习，就能从数据中学到很多很多很多很多能力，多到超出原始设计者的想象。

比方说，它在翻译方面的能力，不输于，甚至超过了专业的机器翻译系统。

本文开头机翻的比尔盖茨的话，我觉得就比翻译得要好上一个层次。唯一瑕疵是用了比较生僻‘元界’，而不是更常用的‘元宇宙’。但当我告诉它‘元宇宙’更常用后，它立刻就能修正翻译：

据说，翻译能力并不是特别着意打造的，它只是读的多语言数据多了，就会了

再比如，偶然把源代码加到了训练数据里，结果发现 AI 的推理能力获得了巨大提升。

传闻说，在发布时，只是被当成又一个新版本的 demo 而已，并没觉得它会多强大（前几个版本市场反应也是寥寥）。是网友贴在社交媒体的对话截图，让才知道，原来它还能这样这样这样这样这样！

有没有一丝丝觉得，的机器学习能力，已经很像人类的学习过程了？

让小孩子学编程的主要原因，是锻炼孩子的逻辑思维能力。这不和 AI 读代码学推理是一回事吗？

古人就说，‘读书百遍其义自见’，‘熟读唐诗三百首，不会作诗也会吟’。如果有一个少年，他可以不眠不休地快速读书。我们不知道他读完全世界所有书之后会是什么样，但相信他一定会很厉害。

如此接近人，让很多专家承认，我们终于敲开了通用人工智能（，下文简称 AGI）的大门了！

以前的 AI，不是 AGI，是因为它们的模型只能做一件事。人脸识别的就是识别人脸，缺陷检测的就是检测缺陷（且只能检测一种缺陷，换了缺陷就得换模型）。只会下围棋，换成五子棋就会被我狂虐。

而已经能够触类旁通，把从 A 学到的能力，用在 B、C、D、E、F 上。

学术界用‘涌现（）’这个词来表述这种情况。请记住这个词，后面还会用到。

延续的一个研究热点是多模态大模型。简单理解，就是把语音、图像、视频等等各种类型的数据都灌进去，看能否用一个模型解决所有媒体的 AI 生成问题。

如果成功，那么再大胆假设一下，凡是数据，是不是都可以交给这个模型训练，让它学会如何从 A 生成 B？比如，从剧本直接生成电影，从 PRD直接生成可执行的 App，从口头描述直接生成 3D 人物，从需求直接生成一切！