商汤科技类似chatgpt的产品商汤版ChatGPT来袭，中国激战千亿“大模型”

默认分类1年前 (2023)发布 admin

2,041 0 0

随着为代表的预训练大模型带来新一轮人工智能（AI）热潮爆发，继百度、阿里、360之后，又一家大厂推出GPT大模型产品。

钛媒体App获悉，4月10日，AI 公司商汤科技正式发布全新“日日新”大模型体系，以及自研的中文语言大模型应用平台“商量”（），参数量达千亿，可实现文本生成、图像生成、多模态内容生成等能力与场景应用。

商汤科技董事长兼CEO徐立表示，上述这些生成式人工智能（AIGC）产品将在医疗、短视频、教育、营销以及开发等产业领域应用落地。

商汤科技联合创始人、首席科学家王晓刚表示，目前已经有一些合作伙伴和客户开始内测其产品。未来，商汤版的GPT主要面向企业端（B2B）业务。此外，商汤“日日新”大模型体系已全面支持了智能汽车、智慧生活、智慧商业、智慧城市等业务板块，而且商汤将向客户提供涵盖图片生成、自然语言对话、视觉推理和标注服务等API接口。

事实上，自2022年12月开始，美国公司推出的 AI 产品以及背后的GPT大模型，已经引发了一场 AI 新浪潮。

但 AI 技术的终极目标通用人工智能（AGI）可不是谁都能获得的。《奇点临近》作者雷·库兹韦尔曾表示，直到2029 年，人类才有超过50%的概率开发出AGI。而作为 AI 技术积累最深厚的中国公司，如今商汤抓住了大模型这波新浪潮，以期在未来几年内实现重大突破，从而迈向 AI 领域这颗皇冠上的明珠——AGI的前沿研发与商业化进程。

GPT大模型热潮来袭

如今，火爆全网的 AI 聊天大模型应用访问量已飙升至8.89亿次，它也是历史上最快达到1亿月活的应用，而且整个热潮已蔓延至微软、谷歌等很多大厂开始关注大模型。过去40天，大模型集中爆发，GPT-4、微软 365 、 V5、 PaLM API、英伟达新显卡接连出场。

尤其是微软，将GPT-4接入Word、Excel、等 365 办公套件中，即推出一款新的 AI 驱动的产品（副驾驶），像助手一样用 AI 帮助人们生成文档、电子邮件、PPT等，从而让 AI 接入了生产力。此外，创造出的美国公司还推出插件功能，实现了“App Store时刻”，让生成式 AI 真正变革了人类的生产力。

GPT-4加持的微软Word平台，支持自由编辑 AI 生成的文本

天津大学自然语言处理实验室负责人、教授熊德意表示，从 AI 发展角度看，这是一个重要的里程碑，其意义要高于7年前的“阿尔法狗”。

实际上，过去60多年间，利用 AI 技术，智能化、数字化和人口红利共同推动了中国工业与产业快速发展，尤其是深度学习十年间的快速进步，真正让 AI 在很多领域突破了“工业红线”，在诸多特定的垂直场景中带来了效率的提升。

不过，定制化AI模型的开发模式，依然面临研发成本高、周期长等问题，而且现在80%的应用场景都是低频的、长尾的需求，但却面临投入大量人力、收集巨量数据，却不能解决小数据、小样本等实际应用问题。

而谷歌2017年发布的框架催生了新的研究范式，即基于一个强大的多模态大模型，使整个网络结构完全由机制释出，让机器同时学习大量的文字，通过强化学习和人类反馈不断强化大模型的学习能力，从而更高效地解决海量的开放式任务，让 AI 实现了从“数据飞轮”到“智慧飞轮”的演进，最终迈向 AGI 人机共智。

“AI 对于开发者来说是一种模式的变化，下一步对很多内容创作者来说，一样会面临工作模式的巨大变化，未来人们不需要具备底层的制作能力，而是需要更多畅想、连接、协同的能力，这些能力才是跟AI协同共创的核心商业能力。而这种生产力模型的变革，可能会产生互联网SaaS（软件运营服务）应用和工具链，或者基于这些工具链新生成的社区，也就是我们可能会拥有下一阶段的‘小红书’、B站等一系列互联网应用。”商汤科技董事长兼CEO徐立，今年2月谈及引发的商业产业变革时表示。

商汤科技类似chatgpt的产品商汤版ChatGPT来袭，中国激战千亿“大模型”

作为 AI 行业的领头羊，商汤科技拥有很强的技术实力和积累，能够参与到这场大模型军备赛当中。自2018年起，商汤科技便致力于 AI 大模型的研发，有着超过5年的技术积淀和实践经验。目前，商汤已成功研发了320亿参数量的全球最大的通用视觉模型，在自动驾驶、工业质检、医疗影像等多个领域得到广泛应用。

“‘好的原材料’就是要深入到各个行业里积累非常多的know-how。美国公司能够把做出来，背后也有多年积累，从小模型到大模型的研发，中间积累了非常多的know-how。”王晓刚表示，商汤具有非常类似的优势，内部有非常多的研发人员能深入到一线，用大模型去解决实际问题，有很好的技术积累。

王晓刚强调，“我们要拥抱全新研究范式，这里面的关键是我们要转变观念。十年前，商汤还没有诞生，我们创始团队在当时做的决定就是-All In Deep （深度学习）。我们之前在传统视觉技术里也有较长积累，但是，当新技术来了，我们就果断地去拥抱新技术。今天也一样。”

实际上，本轮国产大模型竞赛中，有三个能力极为重要：算力、数据和应用场景。而在国内致力于To B（企业端）业务的大厂中，商汤处于第一梯队。

商汤科技前瞻布局，既依托 AI大装置，以5000 超大规模算力和出色的并行计算能力，为大模型研发提供强大的算力基础设施，堪比芯片行业的“光刻机”；同时还有数据算法和强大的产业化能力，在智慧城市、智慧商业等领域的长期耕耘，商汤积累了海量真实世界的高质量视觉数据，支持商汤在视觉技术方面的持续突破。领先的算力布局，以及丰富的视觉数据和技术积累，为商汤多模态大模型的研发提供有力基础。

徐立曾表示，AI 的核心是解决“工业红线”问题，而商汤 AI大装置相当于粒子对撞机，成为业内稀缺的大模型专用基础设施，可以解决 AI 软件所需算力支撑挑战——类似光刻机，解决芯片的“工业红线”。因此，如今基于“大模型+大算力”，商汤拥有了 AGI 时代的“光刻机”，成为 AGI 和大模型时代的基础设施服务领导者，对整个行业具有重要的应用价值和战略意义。

“需要好的顶层设计，很好地把原材料设计成一个体系，商汤能朝着 AGI 的目标努力。除了大装置和基础设施以外，还要能从算法、框架上，把整个系统设计好。”王晓刚表示。

王晓刚称，如今，商汤研发想要做的事情就是怎么样去用好这些新技术。它带来的新范式包括人机共智，一起去创造新智慧。核心在于怎样用好我们的这个大模型，能够去形成正向的反馈，而不是一味地说“很害怕被颠覆了”。

千亿商汤大模型有何新亮点？

最近几天，国内科技大厂的GPT AI 大模型密集呈现，从百度的文心一言，到阿里通义、华为盘古和京东言犀，引发国内企业的大模型“逐鹿潮”。

相对于其他大模型产品，商汤此次推出的千亿大模型真正服务于To B（企业）端客户，而非一个被网络调戏的工具。钛媒体App梳理了四大亮点和优势，从体系、语言大模型平台，到应用场景和行业落地，打通大模型产业闭环。

首先是国内首个大模型体系。

4月10日，商汤科技正式发布商汤“日日新”大模型体系，基于数据、模型训练以及部署的三位一体的飞轮，提供自然语言生成、图片生成、感知模型预标注、模型研发等多种能力，并持续更新多模态大模型，同时结合决策智能大模型，是实现AGI的重要起点。

商汤科技类似chatgpt的产品商汤版ChatGPT来袭，中国激战千亿“大模型”

据悉，商汤“日日新”大模型体系的名称取自《礼记·大学》中，汤之盘铭曰：“苟日新、日日新、又日新”，商汤希望在模型的迭代速度及处理问题的能力上可以日日更新，不断解锁AGI更多可能。

实际上，大模型最核心的需求就是构建体系架构。而在前期，商汤前瞻性打造了人工智能基础设施 AI大装置——27000块GPU（图形处理器）芯片，5000 超大规模算力、是亚洲最大的智能计算平台之一、支持20个千亿参数超大模型同时训练、支持最大4000卡并行单任务训练，可持续7天以上不间断稳定训练——这是国内为数不多接近GPT所需算力的重要基础设施公司。

如今，基于服务架构，商汤已经打造了CV（计算机视觉）、NLP（自然语言处理）、AIGC（人工智能内容生成）多个AI大模型。未来基于这些核心优势，在“日日新”大模型体系和 AI大装置的支持下，商汤的多模态大模型持续演进，同时结合决策智能大模型，为AGI的实现提供重要起点。

第二大亮点是首个自研中文语言大模型应用平台。

在“日日新”大模型体系当中，商汤科技4月10日还推出了自研的中文语言大模型应用平台“商量”，具备领先的语言理解、生成能力，将科技与人文相互交融。作为高效聊天助手，它可以秒解复杂问题，提供定制化建议，还能辅助创作一流文本，并具备不断学习进化的特性等。

具体来说，在用户价值方面，“商量”可以实现单轮、多轮对话和超长文本理解能力，而且凭借“商量”中文语言大模型强大的长文本理解能力，帮助用户快速通过与大模型互动来获取知识、寻找答案；在技术能力优势方面，商汤拥有千亿参数中文语言大模型，具备问答、理解与生成等全面的中文语言能力，支持企业服务、城市管理、汽车出行等600+垂直领域，并拥有逻辑推演与智能、兼具理解广度与深度、知识自动及时更新等能力。

无论是一人一句编故事，还是连续对话能力，“商量”都能准确、快捷的回答出来。

此外，“商量”已经在行业实现了应用，尤其在医疗行业和编程领域。从现场实际demo当中可以看到，基于大模型应用平台，它能够准确、快捷地回答关于腹部痛等关键性问题，给出医疗参考方案。

第三大亮点是生成式AI应用，真正为短视频、直播产业带来生产力提升。

此次，商汤把GPT大模型应用于生成式 AI 领域，重构人与空间在数字时代的结合。商汤基于“日日新”大模型体系，自研了包括秒画、如影、琼宇、格物等视频内容的制作和生成工具平台，为短视频、直播产业带来生产力的提升。

以“秒画”为例，其是商汤科技打造的AI内容创作社区平台，可帮助用户轻松地创作高质量的艺术作品，自动生成元素和细节，并可不断学习与提升。其中，“秒画”具备超10亿参数自研文生图生成模型，支持二次元、三次元等多种生成风格；推理速度快，单卡支持每2秒生成1张512分辨率的图片；用户可基于单卡A100，5分钟内定制属于自己的LoRA模型20张训练图片；汇聚了1万+开源模型，基于平台发布的模型可设置为ToB服务API，结合商汤大算力对外提供商业化服务，支持用户训练个性化绘模型，满足不同绘画风格需求。