开源语音平台对接chatgpt Toolkit:使用unity实现AI聊天相关功能。目前这个库包含了对chatgpt、chatglm等大语言模型的api调用的代码实现以及实现了微软Azure以及百度AI的语音服务功能,语音服务均采用webapi实现,支持Windows/WebGL/Android等平台
Unity-AI-Chat-
这是一个提供给unity开发者的工具库,用于快速实现AI聊天相关功能。目前这个库包含了对、rwkv以及等大语言模型的api调用的代码实现以及实现了微软Azure以及百度AI的语音合成、语音识别的web api接入。在这个库我们可以通过这代码库,在unity上,快速实现跨平台的应用。
1. unity版本要求
要求.3.44及以上版本
2. 工具内置功能说明
这个工具是根据我之前的AI二次元小姐姐项目整合后的工具包,目前是整合了通用模块,把相关模型包括Vroid以及模型全部删除了,如果需要使用老版本资源的话,文档后面我会放上传送门,自行下载就可以了。
2.1 项目的主要结构
目前这个工具,主要模块包括LLM以及TTS&&STT两个模块:
LLM模块:
=====================
实现的就是针对不同的大语言模型的api调用的代码实现。目前已经实现的大语言模型包括:
:
集成了 3.5/4 的api接口,使用这个脚本,需要在脚本参数里填写的api key, 默认设置的模型是-3.5,如果要替换,需要自行修改模型名称;
:
集成了对官方示例的api接口,如果使用官方的仓库部署的api服务,就可以直接使用,需要配置的内容是,配置部署好的api地址即可;
rwkv:
集成了针对rwkv 开源项目的api接口,因为rwkv 这个项目的api格式和是一样的,如果下载rwkv 这个项目使用的话,可以使用工具提供的脚本,只需要在api地址参数配置实际的地址就可以了。
星火大模型:
集成了科大讯飞的星火大模型的api对接功能,可根据需求自行配置V1.5/V2.0版本
百度智能云千帆大模型平台:
集成了百度智能云千帆大模型平台模型api服务,包括文心一言等十种模型
智谱AI开放平台:
集成了智谱AI开放平台下, Turbo模型的api支持
工具:
集成对部署的本地大模型的API调用支持,可以利用模块驱动AI小姐姐聊天
TTS&&STT模块:
=====================
这个模块实现了对语言模型反馈信息的语音合成功能的代码实现,以及发送信息时,可能用到的语音识别服务相关的代码实现。目前已实现的语音产品包括:
微软Azure语音合成以及语音识别服务:
如果使用这个服务,需要准备微软Azure的语音服务令牌,自行注册账号,开通服务获得;
百度AI的语音合成以及语音识别服务:
使用这个服务时,注册百度AI开放平台的账号,开通语音合成、语音识别服务,创建应用获取到相关的密钥,填入相应脚本即可。
平台提供的在线语音识别服务:
集成了平台的在线语音识别api,需要使用的api key集成了平台的TTS语音合成api,可实现语音合成功能
提供针对开源的模型的api集成:
集成的项目是上开源项目:部署这个项目,可使用本模块来调用语音识别的api
提供针对科大讯飞语音服务的api集成:
实现了对科大讯飞语音服务的api集成,采用了方式,可使用科大讯飞的语音识别以及语音合成服务
WOV模块:
=====================
这个模块实现了关键词语音唤醒相关的功能,能够通过实时监听关键词,进行对话功能的唤醒
Unity内置关键词识别:
使用了.库,实现的关键词识别功能,支持在平台下的语音唤醒功能
角色口型:
=====================
使用了的方案,并集成到了项目包里,可以使用本方案实现平台的音频转口型的效果。完整的插件地址,可以自行下载:
2.2 模型如何使用
示例场景里编写了一个调用示例,查看一下对象。
在配置面板上,根据自己的需求,配置以及ttsstt脚本就可以了。
3. 关于发布到WebGL方法
因为这个项目用到了unity内置的类,webgl是不支持这个类的,所以工具也整合了别的大佬的解决方案,具体可在工具包路径下找到Tool,查看具体的配置说明。unity端的代码已经在示例场景做过配置,不需要再处理,只需要在导出的webgl项目中做相应的代码调整即可
4. 旧版本项目传送门
旧版本项目会包含\微软azure\VITS等几个项目示例,可以以下传送门获取
ample:
vits—unity-wife:
323AI导航网发布