人工智能chatgpt 底层逻辑当AI懂创作、会画画，AIGC爆发的底层逻辑是什么？

默认分类2年前 (2023)发布 admin

2,049 0 0

「核心提示」

无论是卖出天价的AI作画，还是近期风靡全球的，都预示着AIGC（人工智能生成内容）赛道将迎来产业大爆发。此时，理解AIGC的演进历程和底层架构，以及AIGC会带来哪些改变，将成为观察产业趋势的关键。

作者|李鑫

编辑 |刘杨

未来的艺术展，会不会变成机器人之间的PK？

这个问题如果问在几十年前，人们可能会说这是遥远的科幻，而在人工智能（AI）一日千里的今天，回答它恐怕需要思考再三。

2018年，一幅由AI创作，名为《埃德蒙·贝拉米画像》曾在纽约佳士得拍卖行以43.25万美元的价格被拍下——这是估价的40多倍，成为第一幅被拍卖的人工智能作品。

去年9月，另一幅名为《太空歌剧院》的作品获得了美国科罗拉多州博览会艺术比赛的金奖。令人意外的是，这幅作品并非作者杰森·艾伦亲自手绘，而是用AI作画工具完成。

赛后，两位评委都称此前并不知道是AI工具，但二人随后也都表示，即使他们知道，同样也会授予作者最高奖项。这一度引发AI创作的作品该不该拿来参加比赛的大讨论。

不过，如果和最近火遍全球的做对比，AI作画似乎只是开胃菜。这个能作诗、编悬疑小说、甚至写代码的人工智能聊天机器人，上线两个月便收获1亿用户，以至于特斯拉CEO马斯克直言：“非常好，我们离强大到危险的AI不远了。”比尔·盖茨甚至定性的出现“不亚于互联网和个人电脑的诞生”。

AI作画、有什么共性？本质上，它们都属于AIGC的范畴，即人工智能生成内容。

AIGC潜力不容小视，根据预测，AIGC将在2022年后迎来应用的爆发。预计市场空间将由2022年的108亿美元上涨至2032年的1181亿美元，10年的复合增速高达27%。

可见，AIGC将会在未来的商业世界中扮演越来越重要的角色，此时了解其演进历程和底层逻辑将成为关键。

技术、需求双轮驱动

AIGC看似一夜爆发，实则是多年技术沉淀的结果。

1957年，历史上第一支由计算机创作的音乐作品《依利亚克组曲》诞生，这被看作AIGC故事的起点。

不过，在人工智能发展初期，受限于种种因素，相关算法大多基于预先定义的规则或者模板，远算不上智能。而相关高昂的系统成本无法带来可观的商业变现，也让各国政府纷纷减少在人工智能领域的投入，AIGC 没有取得显著进展。

AIGC真正引发市场关注，来自近年生成式对抗网络（GAN）、、扩散模型（ Model）等深度学习生成算法相继涌现。这些生成算法为AI高品质输出内容打下基础。

比如画出获奖作品《太空歌剧院》的，就参考了CLIP和，构建了自己的闭源模型。而的底层——AI大模型GPT3.5，底层技术则是来自2017年谷歌重磅发布的。

如果说技术推动只是AIGC发展的左脚，那么创新需求的牵引，则是AIGC加速落地的右脚。

随着用户对内容数量和质量的需求爆增，但传统的内容生产模式在产能和质量上，正逐步暴露短板。

内容的生产方式可分为三类：偏传统的专业生成内容（PGC）、用户生成内容（UGC）、更新颖的人工智能生成内容（AIGC）。

PGC内容往往制作标准高、工作周期长，但由于供给端人力资源有限，PGC难以满足大规模内容生产的需求；UGC模式则相反，它满足了个性化需求且提高了容量上限，但由于其对制作者、生成工具、内容话题没有限制，质量无法保证。

AIGC虽然暂时无法替代这两种内容生产模式，但能对两种生产方式起到优化作用。借助AIGC，创作者一方面能够通过持续深度学习提升内容的专业性；另一方面AI也能辅助专业创作者，提升创作效率。

在文本领域，腾讯打造的“梦幻写手”的新闻写作系统能够在规定的22种场景中进行写作，具有0.46秒的平均发稿速度；在音频领域，风险投资机构a16z曾透露，Siri联合创始人Tom 目前已经打造了能够实时动态编曲的自适应音乐平台。用户只需向输入一系列的音乐“原材料“，AI就会改编并实时混音，带来音乐表演。