团队规模不足百人(共 87 人)。分析发现,其显著特征是“年纪很轻”、“背 景豪华”、“聚焦技术”、“积累深厚”、“崇尚创业”和“华人抢眼”。
该团队平均年龄为 32 岁,“90 后”是主力军。他们引领的这一波大型语言模型技术风 潮,充分说明了那些经常被认为研发经验不足的年轻人,完全有可能在前沿科技领域取得重 大突破。
团队成员绝大多数拥有名校学历,且具有全球知名企业工作经历。从成员毕业高校分布 看,校友最多的前 5 大高校是斯坦福大学(14 人)、加州大学伯克利分校(10 人)、麻省 理工学院(7 人)、剑桥大学(5 人)、哈佛大学(4 人)和佐治亚理工学院(4 人)。另 外,该团队有 3 人是我国清华大学校友,即翁家翌、赵盛佳、袁启明,他们本科均在清华大 学就读,目前均在团队担任研发工程师一职。 不一味强调高学历,其成员并非“清 一色”的研究生学历,而是本、硕、博人数相对均衡。
团队成员有 10 人从谷歌跳槽加入,其他成员也大多来自 、、Uber、 Quora、、、、、Apple、Intel 等顶尖或知名科技 公司。另外,该团队有 5 人被评为 2023 年度“AI 2000 全球人工智能学者(全名单链接: )”,其中 2 人为 联合创始人,2 人分别被评为 全球机器人和机器学习领域最具影响力学者。可见,技术型顶尖学者对创新型团队的引领作 用至关重要。
从成员职位构成看,该团队成员近 9 成为技术人员,未配备技术与产品之外的职能人员 (如公共关系、市场营销等人员),而是高度聚焦于技术研发。由此可见,在数字化传播时 代,一款人工智能产品只要性能足够优异,即使未配置专人做推广营销,也能在短短的一两 个月时间内在全球引爆。
是 在大型语言模型领域多年技术积累的结果。统计发现,在与 相关的先前 7 大技术项目研发中, 团队成员参与人数最多的是 CodeX 项目,共有 22 人参与过,占总团队人员总数的 25%;其次是 和 , 共有 9 人参与过;第三是 GPT3,共有 6 人参与过;第四是 RLHF,共有 3 人参与过。由此 可见, 团队成员在生成式预训练语言模型领域有较深厚的技术积累,特别是 1/4 团队成员曾参与过同样基于 GPT3 的 CodeX 项目的研发经验,对后续成功研发 打下了坚实的基础。
团队中的华人表现抢眼。团队共有华人 9 人,占团队总人数 10%。其中 5 人 本科就读于中国内陆高校,3 人大学教育经历均在美国高校完成。梳理毕业于中国内陆高校 的 华人成员成长路径发现,他们就读于中国内陆顶尖高校的学习阶段均为本科, 之后赴美深造,获得硕士或博士学位,然后加入美国诸如 、 等创新型公 司。
华人学者欧阳龙参与了与 相关的 7 大技术项目中的 4 大项目的研发,他是 论文的第一作者,是 RLHF 论文的第二作者,可见他是这两个关键技术项目的 核心人员。 根据以上分析所获相关启示,就国内人工智能前沿技术发展提出以下建议:1)注重科 技兴趣和信仰培育,鼓励优秀年轻人投身于前沿技术创新浪潮;2)“大厂”前沿科技创新 疲态显现,鼓励年轻人将目光投向创业公司;3)海外华人学者是全球科技创新的重要力量, 鼓励加强对外学术交流。