2023年4月,中国AI专家陆奇在一次演讲中充满信心地表示,未来将是一个无处不在的模型时代。他大胆预测,总有一天,大型人工智能模型将能够在手机上运行。
仅仅两个月后,一段关于高通公司演示其最新技术“稳定扩散”的视频在网络上迅速传播开来。
视频中,一位操作人员展示了在一部没有联网的安卓手机上使用“稳定扩散”技术生成人工智能图像的过程。整个生成过程不到15秒,而且完全在手机终端上进行,生成的图像效果毫不逊色。
这一次,陆奇关于大模型能够在手机上运行的预言被高通公司提前变成了现实。这一突破性的技术进展引起了广泛的关注和赞叹。
根据数据显示,目前已经有超过3000个可用的生成式人工智能(AI)应用和特性,几乎所有全球科技巨头都在积极布局AI大模型。
然而,大模型的成功与否高度依赖于算力的支持。一个人工智能大模型通常需要使用数万亿个单词进行训练,参数量也飙升到了上万亿。
以GPT为例,OpenAI在2018年推出的GPT参数为1.17亿,预训练数据量为5GB,而GPT-3的参数量达到了1750亿,预训练数据量达到了45TB。在模型训练阶段,总算力消耗约为3640 PF-days,总训练成本为1200万美元。国内的华为”盘古”大模型的参数最多可达到1.085万亿,而阿里达摩院的M6最新参数已经从万亿跃迁至10万亿。
一个共识已经形成:谁能够解决算力成本问题,谁就拥有优先话语权。
面对这一现状,科学界的许多”优等生”们集中精力研究更好的算法和更高能效的芯片,这成为主流发展方向。然而,长期以来专注于芯片领域的”尖子生”高通却默默地提交了一份与众不同的答卷——混合人工智能(AI)。
混合AI的关注点是如何降低AI计算的成本并提高效率:
混合AI通过终端和云端的协同工作,在适当的场景和时间下分配AI计算的工作负载,以提供更好的用户体验并高效利用资源。
这个理念可以用章鱼这种动物来解释。章鱼拥有巨量的神经元,其中60%分布在章鱼的八条腿上,仅有40%分布在大脑中。因此,章鱼的触角具有独立思考能力和敏捷的反应能力,在捕猎时表现出异常的灵巧和迅速,腕足之间的配合也非常出色,从不会缠绕打结。
在这个比喻中,章鱼的大脑相当于我们常说的云端,而触角则相当于边缘端,例如手机和其他终端设备。
当章鱼狩猎时,它会使用离物体最近的触角来处理任务。
对于一个AI任务来说,混合AI就像是这个章鱼,根据模型和查询需求的复杂度等因素,决定将任务分配给哪个触角来处理,以实现最快和最高效的结果。有时候可能需要使用A触角,有时候需要同时使用A和B触角,有时候则需要将任务交给大脑处理,一切都取决于任务的复杂程度。
例如,如果模型的大小、提示(prompt)和生成长度都小于某个限定值,并且能够提供可接受的精确度,推理过程可以完全在终端设备上进行。而对于更复杂的任务,模型可以在云端和终端设备之间进行运行。
此外,混合AI还支持模型在终端设备和云端同时运行,也就是在终端设备上运行轻量级模型的同时,在云端并行处理完整模型的多个标记(token),并在需要时纠正终端设备上的处理结果。这种方法可以极大地解决能耗和成本问题。
隐私方面,高通在处理上也非常得心应手。他们直接从源头减少了数据的传输过程,从而消除了隐私泄露的问题。
高通指出,在他们的混合AI架构中,有一个特殊的“隐私模式”。当用户使用终端设备的AI功能向聊天机器人输入一些敏感话题,比如健康问题或创业想法,这个模式会自动启动,保护用户的隐私。
高通的AI实力不仅仅体现在提出创新理念上,他们已经通过具体的实践来构建了自己的AI王国。
在硬件方面,高通的终端设备已经搭载了超过20亿台搭载高通AI引擎的产品。他们提供了强大的计算能力和大容量的存储空间,为终端侧的AI性能提供了领先的支持。
在算法方面,高通拥有一支专门的研究团队,致力于神经网络架构的开发和调整工作。他们推出了一种名为FrameExit的模型,可以根据视频帧的复杂度来调整所使用的神经元数量,从而提高性能和精确度。
在软件方面,高通推出了AI软件栈,将各种AI软件产品整合到一个软件包中。开发者可以在这个软件栈中找到各种主流的AI框架和工具,从模型设计到优化、部署和分析,都可以在这个平台上完成。
高通对AI的布局早已开始。从2013年发布的Zeroth处理器开始,他们就开始探索AI的可能性。随后,他们在各个领域进行了深入研究和合作,推出了一系列的AI产品和技术。而最新发布的高通AI软件栈和混合AI架构,再次展示了高通在AI领域的决心和长远规划。
一家全球基因硬件公司正在通过算力成本上的创新,为AI赛道带来前所未有的突破性进展,这可能成为一个里程碑式的事件。
这一突破性进展为我们留下了巨大的想象空间。
这种想象空间源于高通公司不断自我革新的精神。
此外,高通在硬件领域的优势以及众多已经扎根的应用领域,将进一步扩大高通在AI领域的布局。
高通的白皮书表示:“我们的AI能力将赋予各种产品以智能,包括手机、汽车、XR、PC和物联网。”
例如,在汽车领域,高通推出了首款可扩展自动驾驶SoC平台,采用了5纳米工艺制程。本田、梅赛德斯、雷诺、沃尔沃等数十家厂商都在其车辆上使用了这一平台。
未来,AI将赋予人车交互体验更智能化的能力。例如,在高通数字座舱中,用户可以与自己的车进行真正的对话。你可以告诉你的车:“导航带我去机场,但是在去机场的路上,我要找个地方吃个汉堡,再找个地方喝某种口味的咖啡,顺便把我之前干洗的衣服取了。”高通的AI助手将能够高效地满足你的所有需求。
“与其他商用终端不同,汽车中的任何小错误都可能带来严重后果。因此,我们不仅要确保提供最佳体验,还要确保极高的准确性。”高通技术公司产品管理高级副总裁兼AI负责人Ziad Asghar表示。
与此同时,结合搭载高通平台的各种设备,混合AI可以在保护用户隐私的前提下应用于全球40%的手机、高通的16000家客户相关的物联网设备、65款采用高通骁龙平台的XR终端以及未来其他智能设备,推动高通在AI领域的无限延展。
混合AI让“在终端上运行大模型”这一概念从将来时变成了现在时。
高通在某种程度上已经从一家传统的芯片企业转变为AI领域极具潜力的黑马。
总结高通的白皮书,凭借早期的前瞻性研究和产品开发投入,目前骁龙平台已经能够支持超过10亿参数的生成式AI模型,并即将支持100亿或更多参数的模型。
高通多年来一直以高度凝练的方式呈现在大众面前,只关注数据。在当前的环境下,对于AI行业来说,只有高度凝练的“真实”才能不辜负这个时代。如果我们将科技企业放在这样一个维度上要求,那么对于高通即将带来的颠覆性变革,或许我们值得期待。
323AI导航网发布