人工智能chatgpt芯片 人工智能算力先行 国内八家AI算力芯片

默认分类1年前 (2023)发布 admin
714 0
ChatGPT国内版

自主可控受高度重视,国产AI算力芯片迎“芯“机遇。两会期间,高层指出,加快实现高水平科技自立自强,是推动高质量发展的必由之路。此外,国务院组建国家数据局,负责统筹推进数字经济发展、推进数据基础设施布局建设等任务,有望加速推进数字中国建设落地;国务院重组科技部,并组建中央科技委员会,亦有望加速推动国内高水平科技实现自立自强。AI算力芯片作为数字中国的算力基础,国产突破势在必行,国产AI算力芯片迎来发展”芯“机遇。

AI芯片赋能算力基石 英伟达垄断全球市场

AI算力芯片主要包括GPU、FPGA,以及以 VPU、TPU为代表的ASIC芯片。其中以GPU用量最大,据IDC数据,预计到2025年GPU仍将占据AI芯片8成市场份额。然而,相较传统图形GPU,通用型算力GPU在芯片架构上缩减了图形图像显示、渲染等功能实现,具有更优的计算能效比,因而被广泛应用于人工智能模型训练、推理领域。

根据在网络中的位置,AI芯片可以分为云端 AI芯片、边缘和终端AI芯片;根据其在实践中的目标,可分为训练()芯片和推理()芯片。云端主要部署高算力的AI训练芯片和推理芯片,承担训练和推理任务,具体有智能数据分析、模型训练任务和部分对传输带宽要求比高的推理任务;边缘和终端主要部署推理芯片,承担推理任务,需要独立完成数据收集、环境感知、人机交互及部分推理决策控制任务。

由于英伟达GPU产品线丰富、产品性能顶尖、开发生态成熟,目前全球AI算力芯片市场仍由英伟达垄断。根据中国信通院的数据,2021年Q4英伟达占据了全球 95.7%的GPU算力芯片市场份额,因此,英伟达数据中心业务营收增速可以较好地反应全球AI芯片市场增速。2023财年,英伟达数据中心营收达到150亿美元,同比增长41%,-复合增速达63%,表明全球AI芯片市场规模保持高速增长。

性能与生态构筑AI算力芯片高壁垒

评价AI芯片的指标主要包括算力、功耗、面积、精度、可扩展性等,其中算力、功耗、面积(PPA)是评价 AI 芯片性能的核心指标:

1、算力:衡量 AI 芯片算力大小的常用单位为 TOPS 或者TFLOS,两者分别代表芯片每秒能进行多少万亿次定点运算和浮点运算,运算数据的类型通常有整型8比特(INT8)、单精度32比特(FP32)等。AI芯片的算力越高,代表它的运算速度越快、性能越强。

2、功耗:功耗即芯片运行所需的功率,除了功耗本身,性能功耗比是综合衡量芯片算力和功耗的关键指标,它代表每瓦功耗对应输出算力的大小。

3、面积:芯片的面积是成本的决定性因素之一,通常来讲相同工艺制程之下,芯片面积越小良率越高,则芯片成本越低。此外,单位芯片面积能提供的算力大小亦是衡量AI芯片成本的关键指标之一。

除PPA之外,运行在AI芯片上的算法输出精度、AI应用部署的可扩展性与灵活性,均为衡量AI芯片性能的指标。

除GPU硬件之外,与之配套的软件开发体系亦是生态的重要组成部分。GPU的生态包括底层硬件、指令集架构、编译器、API、基础库、顶层算法框架和模型等,英伟达于2006年发布的CUDA平台是当今全球应用最为广泛的AI开发生态系统。通用GPU与CUDA组成的软硬件底座构成了英伟达引领AI计算的根基,当前全球主流深度学习框架均使用CUDA平台。

生态构建计算壁垒,国产GPU厂商初期兼容CUDA,长期仍需构筑自身软硬件生态。由于当前全球主流深度学习框架均使用CUDA平台进行开发,国产GPU可以通过兼容CUDA的部分功能,快速打开市场,减少开发难度和用户移植成本。

然而,CUDA本身涵盖功能非常广泛,且许多功能与英伟达GPU硬件深度耦合,包含了许多英伟达GPU的专有特性,这些特性并不能在国产AI芯片上全部体现。长期来看国产GPU厂商仍需通过提升自身的软硬件实力,构筑属于自己的软硬件生态。

国产AI算力芯片全景图

全球AI芯片市场被英伟达垄断,然而国产AI算力芯片正起星星之火。目前,国内已涌现出了如寒武纪()、海光信息()等优质的AI算力芯片上市公司,非上市AI算力芯片公司如沐曦、天数智芯、壁仞科技等亦在产品端有持续突破。

1、寒武纪()

人工智能chatgpt芯片 人工智能算力先行 国内八家AI算力芯片

成立于2016年,研发团队成员主要来自于中科院,董事长陈天石曾任中科院计算所研究员。寒武纪AI芯片思元290面向云端训练,思元370面向云端训推一体,两款芯片均采用7nm制程工艺。此外,思元370是寒武纪首款采用技术的AI芯片,最大算力高达;训练侧新品思元590在研发中。

2月27日,寒武纪发布2022年业绩快报,实现营收7.29亿元,同比增长1.11%;实现归母净利润-11.66亿元,亏损同比扩大41.40%。寒武纪2022年归母净利润亏损同比扩大主要原因系公司研发费用、资产减值损失、信用减值损失有所增长。

2022年,寒武纪云端产品已打入阿里云等头部互联网客户,并与头部银行等金融领域客户进行了深度技术交流,同时亦得到了头部服务器厂商的认可。展望2023年,随着为代表的AI大模型不断涌现,AI算力需求有望加速增长,从而驱动AI算力芯片需求增长。寒武纪作为国内领先的AI芯片公司,产品研发、市场拓展、客户导入均有较强先发优势,有望深度受益AI发展的浪潮与AI算力芯片国产化趋势,在23年取得快速成长。

2、海光信息()

海光信息成立于2014年,公司骨干研发人员多拥有国内外知名芯片公司的就职背景,拥有成功研发x86处理器或ARM处理器的经验。海光信息的DCU芯片深算一号采用7nm工艺,兼容“类 CUDA”环境,软硬件生态丰富,已于2021年实现规模化出货,未来将广泛应用于大数据处理、人工智能、商业计算等领域。

2月23日发布2022年业绩快报,实现营收51.25亿元,同比增长121.83%;实现归母净利8.02 亿元,同比增长 145.18%。2022年,海光信息在保持高研发投入的同时,大力拓展国内市场,有效提升了公司在国内高端处理器领域的领先优势和市场地位,业务稳步增长。

3、沐曦集成电路

沐曦集成电路成立于2020年,公司创始团队处于国内顶尖行列——创始人陈维良曾任AMD全球GPGPU设计总负责人;两位CTO均为前AMD首席科学家,目前分别负责公司软硬件架构;核心成员平均拥有近20年高性能GPU研发经验。沐曦于2022年7月完成10亿元Pre-B轮融资,由混沌投资领投。沐曦首款异构GPU产品采用7nm制程,已于2022年8月回片点亮,主要应用于推理侧;应用于AI训练及通用计算的产品已于2022年12月交付流片,公司计划2024年全面量产。

4、天数智芯

天数智芯成立于2015年,首席科学家郑金山为原AMD首席工程师,首席技术官Chien-Ping Lu曾任三星全球副总裁。2022年7月,公司完成超10亿元人民币的C+轮及C++轮融资。天数智芯的Big 云端GPGPU是一款具有自主知识产权、自研IP架构的7nm通用云端训练芯片,这款芯片达到 算力。

5、壁仞科技

壁仞科技成立于2019年,创始人张文曾任商汤科技总裁,CTO洪洲曾任职于海思的GPU自研团队,软件生态环境主要负责人焦国方曾创建高通公司骁龙GPU团队、领导了5代 GPU架构开发。2021年3月,公司完成 B 轮融资,累计融资金额超47亿元。2022年 8月,壁仞科技发布首款 GPGPU芯片BR100,BR100芯片采用技术,其16位浮点算力达到1000T以上、8位定点算力达到2000T以上。

6、燧原科技

对于互联网大厂来说,腾讯、百度、阿里巴巴等均在AI芯片领域大力布局。其中,腾讯投资燧原科技、百度投资昆仑芯、阿里巴巴则孵化了平头哥。燧原科技成立于2018年,公司创始人赵立东曾任紫光通信科技集团有限公司副总裁、AMD计算事业部高级总监;COO张亚林曾任AMD资深芯片经理、技术总监。公司最新发布的第二代推理产品云燧i20是面向数据中心应用的第二代人工智能推理加速卡,采用12nm工艺,通过架构升级大大提高了单位面积的晶体管效率,算力可媲美7nm GPU,达到。

7、昆仑芯

昆仑芯成立于2011年,前身为百度智能芯片及架构部,于2021年4月完成独立融资,首轮估值约 130 亿元。公司团队成员多数成员来自百度、高通、、Tesla等行业头部公司,22年完成 A 轮融资。昆仑芯新品AI芯片 R200于2022智算峰会上正式发布,基于新一代昆仑芯自研架构 XPU-R,通用性和性能显著提升,采用7nm先进工艺,算力可达 。配合百度飞桨平台,获得更友好开发的环境。

8、平头哥

平头哥成立于2018年,由阿里全资收购的中天微与达摩院芯片研发团队合并而来。公司有两条研发主线,一是利用ARM的IP为阿里云数据中心研发芯片,在云端提供普惠算力,即倚天系列和含光系列;另一边集中在RISC-V处理器架构的研发,如玄铁系列,主要应用是在AIoT领域。公司技术团队由原中天微、高通、AMD、华为海思等拥有丰富研发经验的人员构成。平头哥于 2019年9月发布首颗数据中心芯片含光800,采用 12nm工艺,性能峰值算力达820 TOPS。

相关上市公司:

看好以海光信息()、寒武纪()、天数智芯、沐曦为代表的AI算力芯片公司持续突破,以及以芯原股份()为代表的IP公司在AI芯片大潮下加速成长。

风险提示:疫情反复影响生产经营;下游需求不及预期;研发进展不及预期。

© 版权声明
广告也精彩

相关文章

暂无评论

暂无评论...