话说,虽然你我作为普通人没什么感觉,但学画画、做设计的人去年知道AI绘画之后肯定很焦虑。
为什么这么说呢?因为去年12月知道之后,我也有了同感。
整个人就是,坐不住了,简直惊到了,大为焦虑。毕竟也是偶尔写字的,看看就知道这东西有多厉害。
当时就想找一些资讯,看看有没有大牛来评价和解说一下。
但很遗憾,在几个平台上都没搜出太多东西。
现在火了,终于有了大量的人聊这个东西,铺天盖地的资讯推个不停。
最近的一周看了有几十篇文章,还有好几集相关的播客,算是缓解焦虑的一种方式吧。虽然有些纯属白噪音/大路货,但还是看到了一些相对独到的看法。
做了下小笔记,跟大家分享。很多都附了来源,想深入了解的可以点击蓝色字看原文。
最有用的部分可以直接拉到最后,是跟交流时,如何正确提问的一些有效建议。
一、
几个流传的误区
01. 全球最大的程序员问答社区 flow把禁掉了,一时间成为新闻。
但其实是禁了自动回答插件的使用。你其实没有办法控制真实人类的回答是否使用了工具。(via )
02. 的日活据说达到1亿,这是一个以讹传讹的巨大数字。
真实的数字大概在千万级别,但也已经是非常吓人了。
03. 总有人批评它回答中庸古板,不过如此;或者赞美它礼貌克制,会认错,道德底线高。但这些其实都是调教的结果。
它其实完全有能力输出完全不同的风格,就像调配方一样,指定幽默50%,宜人性80%……方法已经存在,使用方式的想象力是无限的。
二、
会取代谷歌搜索吗?
如果你还只是提问这样的问题,就显得很没有想象力。
这种交互方式的变革带来的变化是翻天覆地的。搜索也只是互联网浪潮中的一个山头而已。
未来它极有可能作为一个基础设施,嵌入到所有互联网应用之中。
TMT投资人说的出现,可以让他的TMT投资再做十几年了。未来会有很多平台级机会,应用级机会更是数不胜数。
一个简单的想象,假如每一个 app 都内置一个对话机器人,有自己的脾气和气质,它会记住所有和你的聊天记录,了解你的所有事情,在后台默默地支持你,接受你的指令,同时拥有调动海量知识库的能力……
这将会产生多少种玩法。
三、
一种未来的想象
的未来可能是全脑模型。
它的展现形式不只是文本,或者语音。它可以加摄像头,传感器,拥有类似人类的五感,和你感受同样的现实之后互动。
它了解你的过去,记忆,喜好,能识别你此刻的忧郁,能纠正你健身体态的不足……这样的未来,不需要十年就可以实现。(via 硅谷101)
四、
2023年即将发生的事实
一个即将发生的事实就是互联网海量内容都将由AI生成,AIGC将无孔不入。
现在的短视频平台,已经有很多视频是不需要剪辑师的了。有一种功能,是把文本复制进去,然后AI帮你找素材、帮你配音,最后自动生成一个视频,一键发布。如果能够帮助生成文本,再用这些文字去生成视频,就会形成极其庞大的信息流。虽然,我个人主观上对这种视频不屑一顾,但很有可能它会成为大势所趋——也许它没有营养,但它完成了传达信息的使命。(via )
还会继续升级,公司内部早已研发出GPT-4.0,-3.5只是他们为了抢占市场先机/投石问路,用时半个月推出的落地产品。GPT-4.0预计年内发布,没人知道GPT-4.0会是什么样的怪物,业内猜测可能会通过图灵测试。但就算是目前版本的,也已经被各行各业的人广泛运用,大幅提升工作效率。
五、
为什么
会凭空捏造错误内容
以及
为什么它不擅长数学
是网上所有文本的模糊图像。
可以看作是万维网上所有文本的模糊JPEG。它保留了万维网上的大部分信息,就像JPEG保留了高分辨率图像的大部分信息一样。但是,如果你要寻找精确的比特序列,你无法找到它,你得到的只是一个近似值。
由于文本被高度压缩,你无法通过搜索准确的引用来查找信息;你永远不会得到一个精确的匹配,因为存储的不是单词。
这一篇相当有意思!
(澎湃新闻)
我无法简单总结,因为要想理解这一点,你得先理解“压缩”这个动作,是如何通过算法实现的。这涉及到技术内容的科普。建议看原文。
六、
国内有没有机会,
要多长时间,
能做出类似的平台?
这家公司的核心竞争力,花几年时间也不见得能追赶。
数据和算力是国内暂且可以一拼的。
但是经验和人才的积累呢?早期做机器人团队,研究了很多强化学习的技术,后来又做画画软件 Dalle-2,然后做 、GPT的1代、2代、3代、4代……这个积累你砸钱也砸不出来。
而且还有一个能力,他能把技术通过一套很好的工程的体系去实施出来交付出来。
它和其他的公司和其他的学术的组织最大的区别就是他非常注重,包括 这件事情,它也知道怎么样去控制数据的质量,怎么样去把每一个环节做到非常好,再用一种科学的方法,通过工程师的放大的效应,放大了杠杆,把它的效果做到极致。这是它独特的价值。
因为大模型本身目前来看还是大玩家的一个角力场,这些大玩家肯定每一家都希望有自己的一整套世界领先的大模型的架构。它背后如果没有一套很强的工程能力在支撑,只是靠大力出奇迹,我觉得也是不一定能达到这样的效果。(硅谷101)
七、
如何正确地使用
(写出准确的提示词)
掌握NLP 大模型(例如 )的最基础技能就是学会提问。 效果好不好完全取决于你的 ,也就是提示词。
“我认为,NLP 大模型例如 的应用层 App 最重要的设计要点之一是帮助用户以合适的方式提出问题。”(via 郭宇)
我看了一些情感类、生活类公众号跨界玩,然后下结论说它现在还是比较笨,真是不忍吐槽。效果当然不好啦。
遇强则强,遇弱则弱,遇傻逼则傻逼。
明确一点,它是一个解决问题的工具,不擅长回答开放性问题。
下面来看原则,主要包含以下几个:
# 有效 Prompt
你能总结一下《锻炼的好处》一文的要点吗? # 聚焦、相关
巴黎最好的素食餐厅有哪些? # 具体、相关
# 无效 Prompt
你能告诉我关于这个世界的什么? # 宽泛、开放
你能帮我做作业吗? # 开放
你好 # 无目的、不聚焦
有效使用,来自 Rob 的建议
( on : “’s using . But ‘s STUCK in mode. 10 to get ahead with AI: (cut-and-paste these )” / )
模拟专家,让其扮演某些角色,然后与其对话。这个非常有效。
示例:
你是一家顶级市场研究公司的才华横溢的分析师,毕业于哈佛商学院。指导我创建与 B2B SaaS 公司的 C 级高管联系的内容。我会问哪些开放式问题?优先考虑不常见的专家建议。
–左右滑动查看–
挑战传统叙事,询问与主流叙述矛盾的例子,生成挑战读者假设的内容。简言之,找个刁钻的角度挑衅读者。示例:
主题:发展电子邮件新闻稿
对于上述主题,请举出与主流叙述相矛盾的例子。为挑战假设的发人深省的内容生成大纲。
使用非常规 ,比如开放或抽象 ,这样能获得独特和创造性的响应,通过一些奇怪的 ,可以释放 在寻找生动语言和意想不到的主题方面的创造潜力。示例:
写一首关于文案的诗。
用 10 个形容词形容自己像企业家的感觉。
超级头脑风暴,让 提出新的角度或方法来生成潜在创意列表。示例:
主题:如何使广告素材产出翻倍。
对于上面的主题,集思广益新的角度或方法。优先考虑不常见或新颖的想法。
捕捉自己的写作风格,让他为以后得输出创建风格指南。示例:
分析下面的文本的样式、语音和语气。使用 NLP,创建提示以相同的风格、语音和语气撰写新文章:
(在此处插入您的文本)