架构师()
我们都是架构师!
架构未来,你来不来?
点燃了通用AI浪潮,继农业革命、工业革命、计算机技术革命后,也将可能掀起 AI 技术革命。
业界对 的 AI 算法关注得比较多,但是 已经演变为服务数亿用户的平台服务。近3个月 的 SLA 大约99%,也就是说平均每天大约有15分钟不可用,整体技术架构和可靠性也备受关注。
网站近90天状态图(绿色表示可用,其它表示异常)
没有对外正式分享他们的技术架构,所以很难100%准确知道架构大图,本文尝试从以下几个方面:
绘制了 的主要软件技术栈大图。
1、云服务
是云时代的 AI 创业公司,所有业务都是架设在公有云上,在创业初期得到 AWS 的支持,下面这个对话是 截止2021年公开信息的回答:
上面这段话来自 的官网早期文章介绍,可以看到曾使用了大量 AWS 服务。
近两年又得到微软巨额投资,并且明确了要由 Azure 提供服务。可以肯定 是在转向以 Azure 为主的多云方案,AWS 服务会逐渐减少。
另外使用了 多云管理服务来做云资源的管理。
2、数据库
首先问 自己,基本上都没有明确的答案。不过从官网职位和故障报告可以得到比较准确的信息:
的核心业务数据保存在关系型数据库 中,这个在官方网站有介绍,数亿用户的账号、AK和对话等信息都保存在这里。
2023.2.20号的故障报告也说明了主数据库 发生问题。并且提到使用了的连接池服务。
同时使用了 Redis 集群作为缓存服务,在2023.3.20 爆出了安全漏洞,部分用户可以看到其他人的聊天记录,就是因为踩了 Redis-py 在连接取消状态下会话错乱的 bug,CEO Sam 也在 出来道歉。
另外还在招聘中希望懂 ,这个目前还不确认用在什么场景, 是 Azure 推出的多模数据库,支持 、、、 等兼容性接口,是微软在 NoSQL 领域的旗舰产品。
之前 – ( )在 上提到 使用了 ,但最终讨论下来是 自己胡说的,还不能确认是否真的使用了 或者是在 中使用了 的 API。
另外也通过收购过来的Citus提供的分布式的接口。不确认是否使用了Citus来完成分布式数据库架构。
使用了 这个新一代的云原生数据仓库,并且使用了 来做数据分析。支持多云部署的 对于业务从 AWS 到 Azure的跨云迁移是非常有利的。
3、前端
在Web前端方面,比较明确的是使用了 语言和 React 框架。
移动端目前 还没有正式的 APP 发布,不过已经在招聘 iOS 和 工程师,应该快了。
4、应用与服务编程语言
作为以 AI 为基础的科技公司, 选择 为核心语言,不管是 AI 岗位还是平台软件工程师岗位,都是需要精通 语言。
平台服务选择 ,使用了 里比较流行的 Flask 框架,并使用了 等组件。
5、AI 技术框架
AI 技术框架核心是 ,可能也使用了 。
自己研发了面向 GPU 的算法框架 ,并且在 上开源了(),用于代替 的 CUDA,目标是能更高效的开发机器学习算法。 的编程语言使用了 c++和 。
关于更细节的 AI 训练和部署服务架构还待挖掘。下图是来自网上陈巍博士分享的一张大模型典型架构图,供参考:
6、应用部署与监控运维
容器服务:
监控与运维:(招聘运维开发工程师提到需要懂)
日志服务:
编程语言:、
7、参考文档
▋1. 软件工程师岗位描述:
▋2. 2023.2.20 故障分析报告:
▋3. 开源的地址:
▋4. 在上讨论是否使用了:
▋本文作者:叶正盛, 程序员,玖章算术CEO,原阿里云资深技术专家。
如喜欢本文,请点击右上角,把文章分享到朋友圈
如有想了解学习的技术点,请留言给若飞安排分享
因公众号更改推送规则,请点“在看”并加“星标”第一时间获取精彩技术分享
·END·
相关阅读: