从去年开始几乎每隔一周时间都有一些重大的ai工具产生,到底什么工具时候我们的工作流程,学哪一个可能会有些疑惑。所以搞了一些常见AI工具汇总希望对你有帮助。
总的内容一共划分了四大部分,分别是:
文生图:、·E、 、krita+、、、Whee.
AI视频:Sora、、、pika、、morph (对标)、LCM+、 .
AI音乐:Suno、、 Audio.
AI雕刻:、Meshy AI.
第一部分首先来介绍文生图,我会从出图质量,语义理解的准确性,画面可操控性,实用性等维度考察。
工具一:(简称“MJ”)
是一个由研究实验室开发的先进的人工智能程序,典型的文生图,跟其他的文生图AI对比的优点是生成的图像风格多样,操作简单,没有电脑配置要求,适合文生图的入门选手使用。
缺点是需要付费使用,控制程度低,不能控制物体边缘信息,难于用于电商产品内容生产,有时候服务器会很忙,可能会卡顿;生成的图像可能不够精准或者有些错误,图像编辑方面不足,还有代提升。
等级评价:
·实时出图的质量:☆☆☆☆☆☆☆☆8星·语义理解准确性:☆☆☆☆☆☆☆7星(DELL·E比较优秀)·画面的可操控性:☆☆☆☆☆5星·商业的可实用性:☆☆☆☆☆☆6星——·学习难度:☆☆☆☆☆5星·推荐指数:☆☆☆☆☆☆☆7星
可实行的商业探索:商业项目前期参考(包装,游戏,3D,插画,产品);运营设计(节日或者活动海报);绘本绘画;详情页;影视海报。
1-商业项目前期参考
(包装,游戏,3D,插画,产品等,反正就是各种各样的视觉前期参考
,我用来生成一些场景和3D参考就很顶用,而且快速)
2-运营设计(节日或者产品活动海报等等,制作流程差不多,MJ只是用来生成背景或者整个视觉画面,后期还需要借助PS制作标题字和合成元素)
3-绘本(需要结合ps合成拼凑画面,故事可以由生成)
4-详情页(后期需要运用大量的ps合成元素和产品)
5-影视海报(标题字需要后期自己制作,MJ不能生成中文字体)
工具二: Dell·E
DALL·E 是发布的插件之一,功能主要是文生图,没有多余的功能。可以生成完全符合提示词的图像,并能理解更多的细微差别和细节,对于关键词的理解能力比市面上其他的文生图AI(MJ也包含在内)都要强,可以比较轻松地根据自己的想法生成准确的图像,但是对于设计师要求的画面有比较强的风格化或者出其不意的艺术效果来说还是差了一些。
等级评价:
·实时出图的质量:☆☆☆☆☆☆☆7星·语义理解准确性:☆☆☆☆☆☆☆☆8星·画面的可操控性:☆☆☆☆4星·商业的可实用性:☆☆☆☆☆5星——·学习难度:☆☆☆☆4星·推荐指数:☆☆☆☆4星(同样需要开会员使用,建议直接入手MJ)
可实行的商业探索:运营设计(节日或者活动海报)
运营设计
对于DALL·E 来说做一些前期参考的也是没有问题的,但是在相同的预算情况下我更推荐直接用MJ。
工具三: (简称“SD”,相似工具)
是由 AI公司开发的一款AI绘画生成工具,是一款开源集成软件,一共分为两种界面方式:Web ui和,Webui适合新手入门SD,不适合新手入门,要有一定的SD基础,但是相比起Webui来说更适合团队协作,可以定制工作流重复使用。可以根据自己的喜好安装插件使用,目前可以集成的功能有:文生图,图生图,模型训练,穿越转场视频,(文生动画,图生动画,视频重绘)。
跟其他的文生图AI比较的话优点有三点,第一是开源软件,可以免费使用,第二点是比其他的AI可控性高,可以使用控制物体信息,可以用于电商内容生产,而且满足个性化需求,可以定制ip或者风格模型供企业内部使用;第三:可部署的插件多,满足设计师各个方面需求,如:文生图,图生图,视频制作,模型训练。
缺点是界面操作复杂,需要一定的学习成本,软件不够稳定,容易出现BUG,有电脑配置要求,显存越大,出图分别率越高;相比起MJ来说出图质量不高,需要寻找或者自己训练模型配合使用。
等级评价:
·实时出图的质量:☆☆☆☆☆☆☆☆8星·语义理解准确性:☆☆☆☆☆☆☆7星(这方面DELL·E比较优秀)·画面的可操控性:☆☆☆☆☆☆☆7星·商业的可实用性:☆☆☆☆☆☆☆7星——·学习难度:☆☆☆☆☆☆☆☆8星·推荐指数:☆☆☆☆☆☆☆☆8星
可实行的商业探索:商业项目前期参考(包装,游戏,3D,插画,产品);运营设计(节日或者活动海报);绘本绘画;详情页;影视海报。
1-超级符号和创意文字海报
(对于SD内容生成还可以借助MJ辅助,因为对于创意性海报MJ比SD更能生成意想不到和有张力的画面,生成前期的画面之后,再通过SD后期处理就可以)
2-运营设计
3-插画设计
可以生成线稿,然后进行上色,或者插画师已经有了线稿可以直接进行AI上色。
4-模型训练
可以训练风格化模型/材质模型/IP模型都可以,随心定制。
工具四:krita+(相似工具-)
Krita 是一款自由开源、免费的专业绘画软件,结合sd 使用就可以进行ai实时绘画,相比起 webUI来说操作简单适合新手使用,便于在图上修改局部,主要功能是文生图和图生图。
等级评价:
·实时出图的质量:☆☆☆☆☆☆6星·语义理解准确性:☆☆☆☆☆☆☆7星·画面的可操控性:☆☆☆☆☆☆6星·商业的可实用性:☆☆☆☆☆☆6星——·学习难度:☆☆☆☆☆5星·推荐指数:☆☆☆☆☆☆6星
工具五:集成式文生图工具:(相似工具-Whee)
是一个功能强大的在线工具集合站,可以P图、抠图、移除背景、放大图片、文本删除、涂鸦绘制图片等多项任务,跟WHEE相比起来都是一款AI绘画与图片生成器,提供一站式AI视觉创作服务,WHEE有SD- net文生图和图生图工具,略胜一筹。
等级评价:
·实时出图的质量:☆☆☆☆☆5星·语义理解准确性:☆☆☆☆4星·画面的可操控性:☆☆☆☆4星·商业的可实用性:☆☆☆☆☆5星——·学习难度:☆☆☆☆4星·推荐指数:☆☆☆☆☆5星(网站揽括了大部分我们可以用得上的)
第二部分推荐AI视频生成工具,我会从界面操作难易程度,视频质量、语义理解的准确性以及动态效果的流畅性,视频镜头运动的可操控性,视频时长多个维度进行了比较和分析。
工具一:Sora
Sora可以生成长达60秒的视频,这些视频不仅逼真,而且包含精细复杂的场景、生动的角色表情以及复杂的镜头运动。
等级评价:(Sora未开源,数据来自网络测评)
·实时视频的质量:☆☆☆☆☆☆☆☆8星·语义理解准确性:☆☆☆☆☆☆☆7星·画面镜头操控性:☆☆☆☆☆☆6星·商业的可实用性:☆☆☆☆☆☆☆7星——·学习难度:☆☆☆☆☆5星·推荐指数:☆☆☆☆☆☆☆7星
可实行的商业探索:短视频制作、教育视频制作
工具二:
是一个综合站,不仅可以文本生成视频,还可以进行视频抠像、删背景、运动追踪,根据视频生成不同的风格化,影像延展,影像局部放大等操作,会员用户最多可以制作长达18s的视频,非会员可以免费生成4s视频。
等级评价:
·实时视频的质量:☆☆☆☆☆☆☆7星·语义理解准确性:☆☆☆☆☆☆☆7星·画面镜头操控性:☆☆☆☆☆☆6星·商业的可实用性:☆☆☆☆☆☆6星——·学习难度:☆☆☆☆☆5星·推荐指数:☆☆☆☆☆☆☆7星
可实行的商业探索:短视频制作
工具三:
是一个由香港中文大学、斯坦福大学和上海人工智能研究室的研究人员们共同研发的一款“文本到动画”的扩散模型,之前的AI视频都需要拆成一帧一帧去生成动画,而则是针对视频做的训练,让AI学习到不同类型的运动规律,所以生成的视频会更加流畅自然,而且该模型可以添加到webui和广泛使用,而且开源不需要收费,很多大神直接玩出花来,值得我们去探究,主要功能有文本生成视频、视频转绘视频、图生成视频。
等级评价:
·实时视频的质量:☆☆☆☆☆☆☆☆8星·语义理解准确性:☆☆☆☆☆☆☆7星·画面镜头操控性:☆☆☆☆☆☆☆7星·商业的可实用性:☆☆☆☆☆☆☆6星——·学习难度:☆☆☆☆☆☆☆7星·推荐指数:☆☆☆☆☆☆☆7星
(有电脑配置要求,配合comfy或者webUI使用,生成的视频质量越高,电脑配置就要越高)
可实行的商业探索:短视频制作
工具四:
由 推出的 的全自动CG制作工具,可以自动分析、捕捉真人表演,将其转化为高质量的动画,匹配实拍场景与CG角色与实景完美融合,最后还可以导出动画
,缺点是网站动画里面的主角不能有遮挡,不然就会穿帮,而且网站里面的角色不够丰富,不能做角色定制。
等级评价:
·实时视频的质量:☆☆☆☆☆☆☆7星·语义理解准确性:无(这个只能视频转视频,不能由文本到视频)·画面镜头操控性:无·商业的可实用性:☆☆☆☆4星——·学习难度:☆☆☆☆4星·推荐指数:☆☆☆☆4星
可实行的商业探索:短视频制作、教育视频
第三部分是介绍音乐AI工具,我选了三个,这三个就已经可以很好的帮助到我们日常的一些需求了。
对于音乐的话,我也不是专业的音乐人,那我只根据我日常对音乐的感受和需求分析,就从声音的流畅性,音质效果和对关键词的语义理解的准确性等维度考察
工具一:Suno
生成音乐时长为2分钟,可以延长音乐时长,以用ai模型来生成不同曲风的音乐,可以生成带有人声或者纯音乐的歌曲,人声比较真实,支持不同语言,可以指定主歌副歌部分。
等级评价:
·实时音乐的质量:☆☆☆☆☆☆☆7星·语义理解准确性:☆☆☆☆☆☆6星·音乐效果流畅性:☆☆☆☆☆☆6星·商业的可实用性:☆☆☆☆☆☆6星——·学习难度:☆☆☆☆☆5星·推荐指数:☆☆☆☆☆☆☆7星
可实行的商业探索:短视频音乐合成、影视音乐插曲
suno也能生成中国古风曲,但是效果不好,
工具三: Audio(相似网站:)
可以生成长达三分钟的歌曲,但不能自定义歌词,准确性比suno要高,可以定义包括有结构的作品,包括引子、发展和尾声,以及立体声音效,也有广泛的音乐类型,也支持风格转换,生成效果逼真,并且能够生成的纯音频/音乐效果,跟 Audio相似的网站有,但是功能只能文本转音频没有 Audio这么齐全, Audio主要类型有文本转音频、音频转音频和人声转音频三种,需要付费使用。
等级评价:
·实时音乐的质量:☆☆☆☆☆☆☆7星·语义理解准确性:☆☆☆☆☆☆☆7星·音乐效果流畅性:☆☆☆☆☆☆☆7星·商业的可实用性:☆☆☆☆☆☆6星——·学习难度:☆☆☆☆4星·推荐指数:☆☆☆☆☆☆☆7星
可实行的商业探索:短视频音乐合成、影视音乐插曲
第四部分就是3D雕刻AI类工具了,我会从塑造的模型质量、语义理解的准确性、3D形体的美观度和商业的可实用性等方面来考察。
工具一:
可以很好的根据关键词生成3d模型,支持文本生3d模型和图生3d模型,出来的模型形体较为美观,可以运用到场景或者摆件,精度和拓扑有待提升,所以并不适合产品建模或者质量要求比较高的模型生产。每个账号每个月只有 10 次免费精修模型,之后需要充值会员。
等级评价:
·塑造的模型质量:☆☆☆☆☆5星·语义理解准确性:☆☆☆☆☆☆6星·3D形体的美观度:☆☆☆☆☆☆6星·商业的可实用性:☆☆☆☆☆5星——·学习难度:☆☆☆☆4星·推荐指数:☆☆☆☆☆5星
可实行的商业探索:场景摆件
工具二:Meshy AI
跟大差不差,支持文本生3d模型和图生3d模型,出来的模型质量跟也差不多,并不适合产品建模或者质量要求比较高的模型生产,需要付费使用,目前来说商业实用性并不高,因为精细化不够所以只能作为简单的场景道具模型去使用。
等级评价:
·塑造的模型质量:☆☆☆☆☆☆6星·语义理解准确性:☆☆☆☆☆☆☆7星·3D形体的美观度:☆☆☆☆☆☆6星·商业的可实用性:☆☆☆☆☆5星——·学习难度:☆☆☆☆4星·推荐指数:☆☆☆☆☆☆6星
可实行的商业探索:场景摆件
最后插一句AI课程信息
这个月的5月25/26号会举办一次线下AI 课程,二天一夜,一个周末的时间。地点还是深圳,不需要带电脑哦~ 详情这周三我会发公众号哈~
323AI导航网发布