#寻找数码点评派#
自从,这个能听懂人话的大模型面世后。
机哥就一直在想。
那大概能扭转用户们,对手机语音助手的刻板印象:
人工智能×
人工智障√
没错啊,一直以来,科技巨头们都没少折腾【语音助手】。
推出过的智能音箱呢,也是不计其数。
但真要谈实际表现,机哥觉得,中规中矩叭。
比如我家里的小爱音箱,能听懂我一两句指令,控制智能家居的开关。
但真想和它,实打实地聊天?
sorry,做不到喔。
所以当时出来后,就有一些大佬整活。
用技术手段,把接入到小爱同学上。
但说实话,这终归不是长久之道。
毕竟不是人人都愿意折腾,只有厂商们在大模型领域卷起来,咱们才能真正享受到真正智能的“AI助理”。
好消息是,手机语音助手的大模型浪潮,终于来了。
今年以来,华为先是在“小艺”上,加入了AI大模型。
没过多久,小米又在发布会上,官宣了大模型加持的小爱同学。
后来呢,连OPPO和vivo都有相应动作。
好嘛,就跟约好了似的。
刚好呢,机哥申请的“大模型版”小爱同学通过了。
此时OV的语音助手,又还没推出公测版。
那机哥干脆就拿小爱同学,和大伙一起做个前瞻。
看看被大模型加强过的语音助手,到底能整出啥花活儿。
小爱,你来真的啊?
虽然各家的大模型,在技术上有差异。
不过有一点是能确定的,大模型的训练参数越多,效果就越好。
像这种,就是参数很庞大的模型。
但对于手机端侧来说,参数太大,会导致回答变慢。
所以小米的自研模型MiLM,特意做了两个版本。
一个是6B(60亿参数),另一个是1.3B(13亿参数)。
其中更轻量的1.3B版本,就被塞进了小爱同学的大脑中。
按照雷军的说法嘛,1.3B参数虽然不大,但很多场景下的表现,都不弱于6B版本。
咳咳,听起来还挺带劲的。
那咱们直接进行一个验货,小爱同学,启动!
如大家所见,新版的小爱同学,在界面上就有了明显变化。
App给了【大模型】很显眼的入口。
生怕用户们不知道该怎么使用,还特意内置了很多提示词。
只要按照自己需求挑选,就能快速获得相应的答案。
不过机哥都是“调戏”AI的老手了。
就不搞什么入门操作喽,直接上狠货。
老规矩,先测试一下信息的时效性,我问小爱同学:
“红米K60至尊版和一加Ace 2 Pro的配置对比”。
两台机子都是发布不久,如果有联网能力,应该能准确回答出来。
但从小爱给出的回答来看,目前模型还不具备联网整合能力。
你看它给的处理器还是骁龙8+,还有天玑9000+。
显然是模型数据库中,没有相应参数,所导致的胡言乱语。
这倒是大模型们的普遍调教倾向。
宁愿回答错误,也不直接拒绝。
而隔壁的文心一言,因为早早接入了百度搜索。
时效性遥遥领先,也能准确回答出,机哥问的问题。
至于,小爱同学模型的具体时效性嘛。
机哥觉得,数据起码更新到了2022年中旬。
在这一点上,小爱的模型领先于。
不过,既然模型没联网,机哥也不测时效性问题来难为它了。
我们来点,很考验中文理解能力的,弱智吧经典问题。
首先是:“树上有10只鸟,打死一只,还剩几只?”
这是很经典的逻辑问题,不能用简单的数字加减来算。
而备受期待的小爱同学,居然把问题吃透了。
准确的答案,确实是剩下0只,因为其他鸟会被吓飞…
好嘛,看来小爱的模型,还是有点东西滴。
而百度文心一言这边看着有逻辑,但总感觉别扭。
接下来,机哥可要加大力度了。
我问小爱:“世界上只有五代通讯技术,为啥日本却有万代网络?”
这个问题刻意把5G技术,和日本“万代网络”公司混淆了。
如果阅读理解不到位,很容易绕进去。
好在小爱同学,还是能区分开来的,还知道万代网络是一家公司。
相比之下,能联网搜索的文心一言,反而发挥失常。
文心表示是“翻译错误”,还说“万代网络”可能是特定的网络名称。
看到情况不对,机哥干脆把也拉进来回答。
结果不仅回答得很准确,语言逻辑还贼流畅,就像一位朋友在和机哥交流解释。
只能说,果然是GPT-4,有点降维打击的味道了…
最后,再来个经典的“冰山一角”问题。
小爱这个回答,基本就是个标准答案了。
经过前面的测试,机友们估计也对加入了大模型的小爱同学,有了更深了解。
反正目前来看,跟它聊天唠嗑,绝对是没问题的。
它能联系上下文语境理解,跟咱们聊个痛快,也能承担日常的文案创作。
多少是能给负责文案策划的打工人们,提供一些思路的。
只不过呢,这种玩法着实算不上不新鲜。
毕竟一开始的,就有这种功能。
像谷歌和百度,甚至有了多模态识别能力,给AI扔一张设计草图,它就能把该设计的代码发给你。
再结合小爱同学的官方介绍,和机哥的实测来看。
目前的小爱同学,做的都是和其他通用模型一样的事儿。
所以…
小爱同学到底有没有一些,人无我有的特色功能?
机哥的评价是,有,但不多。
比如这个【小米商城助手】,它就实现了小爱大模型和小米商城的功能融合。
具体来说,它能帮咱们查小米商城所有产品的参数。
还支持一键跳转到某个产品。
倘若不知道该买哪台,也能让小爱同学,做个横向对比。
然后就…没了。
目前的小爱同学,就像是刚加入大模型家庭的萌新,还不能很自由地调用系统功能。
它大部分情况下,干的都是通用模型的活儿。
和或文心一言,这种参数更庞大的模型相比,又没啥优势可言。
但手机算力有限,不太可能把几十亿参数的模型,简单粗暴地塞进去。
机哥觉得,手机语音助手的方向,还是会专注于系统功能的提升。
最后
如果机友们申请到了这波内测,期待可以稍微放低点。
毕竟现在的小爱同学,还不是个完全体。
它甚至还不能在手机端侧运行,一旦断网,立马宕机。
如果后续加入端侧(本地)模型后,再开放更多系统接口权限给小爱,估计体验会好上不少。
比如,接入AI通话,聊天更智能。
又或者,接入米家家居,能更方便操作操作家里的智能设备。
……
不过这都是后话啦~
等后续OPPO小布、华为小艺和vivo Jovi都上了大模型后。
机哥会看情况,再给大家整个更详细的横评。(画饼ing)
图片来自网络