ai模型工具 AI语言大模型之后，AI图像处理工具接连涌现

默认分类1年前 (2023)发布 admin

3,542 0 0

AI图像处理工具，

眼见也不一定为实。

文 | 青崖白鹿

（年5月22日讯）5月10日， I/O大会（谷歌年度开发者大会）正式召开，作为AI语言大模型热潮后的第一次开发者大会，一直都被诟病没有赶上AI发展大势的谷歌。除了依例发布的 14公测版之外，一口气推出了众多搭载AI大模型的功能与应用，或者可以夸张一点， I/O大会上，除了AI还是AI。

Magic 是什么，能做什么

这场大会的开场，谷歌就放了大招——Magic ，这是一款结合语义理解和生成式AI的图像处理工具。Magic 是打造多年的一款工具，早在2015年的 I/O大会就曾介绍过该产品。据悉，谷歌将率先在Pixel上推出Magic ，可使用AI驱动的计算摄影来消除不必要的干扰。今年晚些时候，Magic 将登陆 Photo。

（2023 I/O大会Magic 介绍环节）

在现场演示环节中，谷歌分享了数个Magic 的实际应用范例。具体功能包括调整人物位置、调整天空颜色与状态等，调整后的其他画面将由AI根据图片原信息进行生成和填充，以达到增加图片整体构图美感的效果。在一个范例中，谷歌展示了一张小孩坐在长凳上牵着气球的照片，在使用Magic 进行美化后，AI将长凳、小孩和气球截取了出来，并将其整体移动到了照片的中间位置，甚至同时还将背景的阴天变成了蓝天。

（Magic 应用范例效果图）

Magic 还远远称不上完美，甚至存在一些肉眼可见的BUG，具体发布日期也没有确定。但谷歌的最终目标还是非常明确的：用户只需在屏幕上进行简单的点击和拖拽，就可以创造出完美的照片。换句话来说，谷歌试图将等剪辑软件的高级编辑操作，统统打包整合进Magic 的简单操作中。

Meta SAM是什么，能做什么

无独有偶，今年4月初，Meta AI发布了Meta在CV（，计算机视觉）领域的最新项目，。该项目同时发布了大模型和数据集，大模型命名为 Model（SAM），对应数据集为 1- mask （SA-1B）。其核心思想是开发出一个通用的分割模型，可以在用户输入的指导下分割一切。

ai模型工具 AI语言大模型之后，AI图像处理工具接连涌现

（SAM的流程框架图）

英伟达人工智能科学家Jim Fan更是在其社交平台公开表示：“Meta的，我相信是计算机视觉领域的GPT-3时刻之一。它已经了解了物体的一般概念，即使对于未知对象、不熟悉的场景（例如水下图像）和模棱两可的情况也是如此。并且，模型和数据都是开源的。恕我直言，已经把所有事情都做对了。”

（Jim Fan社交平台截图）

据相关学术报告研究，虽然SAM总体上表现良好，但并不完美。SAM分割模型与当前尖端的伪装物体分割模型之间，依旧存在较大的差距。例如，在自然环境下，SAM模型不能很好地感知场景中的伪装动物，在分割隐蔽动物方面存在一定问题。

实际上，除开以上两者，类似的AI抠图功能在上已经存在，去年的iOS更新后就可以直接使用，但是相较于谷歌的Magic ，的AI抠图还停留在初级阶段，并不会根据内容为用户进行下一步的优化。三星的“Space Zoom”功能也能实现AI“增强”照片，北京智源更是和Meta前后脚发布类似产品，北京智源。

是什么，能做什么

在更广义的范畴上去讲，AI图像处理工具属于AIGC工具的一个子类。那么，号称AI绘画天花板软件的（此处暂不讨论），自然应该有一席之地。于2022年3月面世，只要输入一些简短的文字描述或相关提示词，这款软件就能通过AI算法生成相对应的图片，在较短的耗时内将用户的想象转化为现实。有别于谷歌的和的DALL.E，是第一个快速生成AI制图，并开放给大众申请使用的平台。

（生成图片）

前段时间推出了V5版本，更加强大的功能，让它成为越来越多设计领域创作者的重要辅助工具，尤其是在游戏行业，现在很多工作室都开始使用直接生成原画。当然了，不仅可以作为辅助工具，它还能直接“平替”原画师、设计师们的工作，近段时间以来，不少工作室都进行了相关岗位的裁员优化，对应的行业岗位招聘需求也有所缩减。

AIGC工具对于普通人意味着什么

AIGC工具在技术领域的意义无疑是重大的，这里就不做展开了。本文仅从普通人的视角出发，讨论此类工具出现及普遍应用的意义。从正向的角度来看，此类工具降低了“修图”“设计”等的专业性门槛，对于大众来说，它们是可以让照片变得更好的“神器”，是可以直接制造好看照片的“魔盒”。最简单直白的应用场景就是，游客照的“一键清屏”、抓拍瞬间的瑕疵修复以及好看壁纸的生成。

（AI图像处理效果展示）

凡事都有两面性，如果从消极的角度出发，AGC工具可能造成的后果就是，当假的越来越真，真的也会越来越假。相较于一般智能手机中内置的滤镜而言，此类工具的“修改”能力完全称得上究极进化版本。在AI的操作下，一张普通的照片可能在短短几秒之内发生翻天覆地的变化，让人完全分不清孰真孰假。工具是没有好坏属性的，但使用工具的人有，将这样功能强大的AIGC工具无限制地开源给所有人，可能导致的后果是谁也无法断言的。

ai模型工具 AI语言大模型之后，AI图像处理工具接连涌现

AI完全有能力成为生产力进步的推动者。针对普通从业者，借助AI可以在工作流中进一步提高创造力和生产力，AI也可以通过赋能开发者和企业，帮助他们设计制造具有变革性的产品和服务。如此前微软基于打造的，就可以为用户提供各方面的帮助，如一键生成工作邮件、一键撰写提纲、一键生成文章、报告摘要、制作PPT等。

（微软宣传图）

在前些日子召开的第七届世界智能大会上，百度CEO李彦宏发表了题为《大模型改变人工智能》的演讲，再次阐述他关于生成式人工智能的思考：“对于人类来说，最大的危险，最大的不可持续，并不是创新带来的不确定性。相反的，我们停止创新，不发明不创造不进步，按照惯性走下去，所带来的各种各样不可预知的风险，才是人类最大的威胁。”

（李彦宏第七届世界智能大会演讲画面）

结语

过去的半年时间里，由引发的AI热潮，使生成式人工智能受到了前所未有的关注。如今，AI语言大模型热度依旧，AI图像处理工具又开始涌现，尚且不知这一领域的“GPT”会花落谁家。但毋庸置疑的是，AI，真的“未来已来”了！

本文属原创稿件，转载请洽：

元宇宙→

专访篇→

聊科技→|

评测篇→|

硬技术→|

爱游戏→|

聊行业→|