AI图像处理工具,
眼见也不一定为实。
文 | 青崖白鹿
(年5月22日讯)5月10日, I/O大会(谷歌年度开发者大会)正式召开,作为AI语言大模型热潮后的第一次开发者大会,一直都被诟病没有赶上AI发展大势的谷歌。除了依例发布的 14公测版之外,一口气推出了众多搭载AI大模型的功能与应用,或者可以夸张一点, I/O大会上,除了AI还是AI。
Magic 是什么,能做什么
这场大会的开场,谷歌就放了大招——Magic ,这是一款结合语义理解和生成式AI的图像处理工具。Magic 是打造多年的一款工具,早在2015年的 I/O大会就曾介绍过该产品。据悉,谷歌将率先在Pixel上推出Magic ,可使用AI驱动的计算摄影来消除不必要的干扰。今年晚些时候,Magic 将登陆 Photo。
(2023 I/O大会Magic 介绍环节)
在现场演示环节中,谷歌分享了数个Magic 的实际应用范例。具体功能包括调整人物位置、调整天空颜色与状态等,调整后的其他画面将由AI根据图片原信息进行生成和填充,以达到增加图片整体构图美感的效果。在一个范例中,谷歌展示了一张小孩坐在长凳上牵着气球的照片,在使用Magic 进行美化后,AI将长凳、小孩和气球截取了出来,并将其整体移动到了照片的中间位置,甚至同时还将背景的阴天变成了蓝天。
(Magic 应用范例效果图)
Magic 还远远称不上完美,甚至存在一些肉眼可见的BUG,具体发布日期也没有确定。但谷歌的最终目标还是非常明确的:用户只需在屏幕上进行简单的点击和拖拽,就可以创造出完美的照片。换句话来说,谷歌试图将等剪辑软件的高级编辑操作,统统打包整合进Magic 的简单操作中。
Meta SAM是什么,能做什么
无独有偶,今年4月初,Meta AI发布了Meta在CV( ,计算机视觉)领域的最新项目, 。该项目同时发布了大模型和数据集,大模型命名为 Model(SAM),对应数据集为 1- mask (SA-1B)。其核心思想是开发出一个通用的分割模型,可以在用户输入的指导下分割一切。
(SAM的流程框架图)
英伟达人工智能科学家Jim Fan更是在其社交平台公开表示:“Meta的 ,我相信是计算机视觉领域的GPT-3时刻之一。它已经了解了物体的一般概念,即使对于未知对象、不熟悉的场景(例如水下图像)和模棱两可的情况也是如此。并且,模型和数据都是开源的。恕我直言, 已经把所有事情都做对了。”
(Jim Fan社交平台截图)
据相关学术报告研究,虽然SAM总体上表现良好,但并不完美。SAM分割模型与当前尖端的伪装物体分割模型之间,依旧存在较大的差距。例如,在自然环境下,SAM模型不能很好地感知场景中的伪装动物,在分割隐蔽动物方面存在一定问题。
实际上,除开以上两者,类似的AI抠图功能在上已经存在,去年的iOS更新后就可以直接使用,但是相较于谷歌的Magic ,的AI抠图还停留在初级阶段,并不会根据内容为用户进行下一步的优化。三星的“Space Zoom”功能也能实现AI“增强”照片,北京智源更是和Meta前后脚发布类似产品,北京智源。
是什么,能做什么
在更广义的范畴上去讲,AI图像处理工具属于AIGC工具的一个子类。那么,号称AI绘画天花板软件的(此处暂不讨论 ),自然应该有一席之地。于2022年3月面世,只要输入一些简短的文字描述或相关提示词,这款软件就能通过AI算法生成相对应的图片,在较短的耗时内将用户的想象转化为现实。有别于谷歌的和的DALL.E,是第一个快速生成AI制图,并开放给大众申请使用的平台。
(生成图片)
前段时间推出了V5版本,更加强大的功能,让它成为越来越多设计领域创作者的重要辅助工具,尤其是在游戏行业,现在很多工作室都开始使用直接生成原画。当然了,不仅可以作为辅助工具,它还能直接“平替”原画师、设计师们的工作,近段时间以来,不少工作室都进行了相关岗位的裁员优化,对应的行业岗位招聘需求也有所缩减。
AIGC工具对于普通人意味着什么
AIGC工具在技术领域的意义无疑是重大的,这里就不做展开了。本文仅从普通人的视角出发,讨论此类工具出现及普遍应用的意义。从正向的角度来看,此类工具降低了“修图”“设计”等的专业性门槛,对于大众来说,它们是可以让照片变得更好的“神器”,是可以直接制造好看照片的“魔盒”。最简单直白的应用场景就是,游客照的“一键清屏”、抓拍瞬间的瑕疵修复以及好看壁纸的生成。
(AI图像处理效果展示)
凡事都有两面性,如果从消极的角度出发,AGC工具可能造成的后果就是,当假的越来越真,真的也会越来越假。相较于一般智能手机中内置的滤镜而言,此类工具的“修改”能力完全称得上究极进化版本。在AI的操作下,一张普通的照片可能在短短几秒之内发生翻天覆地的变化,让人完全分不清孰真孰假。工具是没有好坏属性的,但使用工具的人有,将这样功能强大的AIGC工具无限制地开源给所有人,可能导致的后果是谁也无法断言的。
AI完全有能力成为生产力进步的推动者。针对普通从业者,借助AI可以在工作流中进一步提高创造力和生产力,AI也可以通过赋能开发者和企业,帮助他们设计制造具有变革性的产品和服务。如此前微软基于打造的 ,就可以为用户提供各方面的帮助,如一键生成工作邮件、一键撰写提纲、一键生成文章、报告摘要、制作PPT等。
(微软 宣传图)
在前些日子召开的第七届世界智能大会上,百度CEO李彦宏发表了题为《大模型改变人工智能》的演讲,再次阐述他关于生成式人工智能的思考:“对于人类来说,最大的危险,最大的不可持续,并不是创新带来的不确定性。相反的,我们停止创新,不发明不创造不进步,按照惯性走下去,所带来的各种各样不可预知的风险,才是人类最大的威胁。”
(李彦宏第七届世界智能大会演讲画面)
结语
过去的半年时间里,由引发的AI热潮,使生成式人工智能受到了前所未有的关注。如今,AI语言大模型热度依旧,AI图像处理工具又开始涌现,尚且不知这一领域的“GPT”会花落谁家。但毋庸置疑的是,AI,真的“未来已来”了!
本文属原创稿件,转载请洽:
元宇宙→
专访篇→
聊科技→|
评测篇→|
硬技术→|
爱游戏→|
聊行业→|