AWS正在向自己的云平台中增加更多新的功能,帮助开发者更有效地编写代码,并为AI项目生成训练数据集。这些功能于近日在美国拉斯维加斯举行的 re:MARS 2022大会上首次亮相。
AI驱动的编码助手
AWS云产品组合的首个新增功能,是一项名为 的服务,该服务目前处于预览阶段,使用AI自动生成软件代码。据AWS称,这项服务通过自动生成原本必须手动的代码,为开发者节省时间,从而更快速地完成软件项目。
AWS表示,已经用来自开源项目、内部代码库和其他来源的数十亿行代码对进行了训练。该服务能够一次性生成超过10行代码,还可以匹配给定软件项目的编码风格,从而简化某些开发任务。
“利用多个上下文线索来生成建议,包括源代码中的光标位置、光标之前的代码、同一项目中其他文件的注释和代码,”AWS首席布道师Jeff Barr详细介绍说。
软件团队可以使用AWS IDE 工具访问Code ,该工具旨在与开发者的集成开发环境或IDE集成(IDE是程序员用来编写代码和执行相关任务的一种桌面应用)。支持多个主流IDE以及多种编程语言,包括Java、和。
可以根据开发者添加到源文件的自然语言文本生成代码片段。如果开发者输入“检查数字是否为质数”之类的指令,就可以生成执行指定任务的代码片段。如果完成一项任务需要利用云服务或库等外部技术,则可以自动找到必要的技术并将其整合到代码中。
服务的另一个重点是让开发者更容易使用AWS云平台,它简化了在AWS S3存储服务中创建存储桶或数据存储库等任务,此外也适用于其他服务例如 EC2和AWS 。
简化AI训练
除了之外,AWS还更新了 Truth服务。该服务可以帮助软件团队为AI项目创建训练数据集,此次更新加入了合成数据生成功能。
构建AI应用涉及到很多步骤,其中最耗时的步骤之一就是准备训练数据集,可能需要长达数月的时间,因为这通常需要手动创建数据,例如,如果一家公司正在构建一个神经网络来检测生产线上的故障组件,就必须创建一个包含了故障组件图像的自定义训练数据集。
AWS人工智能和机器学习首席开发者布道师Antje Barth在一篇博客文章中解释说:“一旦你收集了所有数据,就需要准确地标记图像,这本身就是一项艰巨的任务。手动标记图像很慢,并且容易出现人为错误,构建自定义标记工具和设置缩放标记操作可能是既耗时又耗费成本的。”
据AWS称,此次更新 Truth将简化这项任务,AWS可以帮助企业创建一个合成的训练数据集,加快AI开发速度,这种合成训练数据集是专门为AI开发目的而生成的文件集合。
Barth详细介绍说:“AWS数字艺术家将首先创建一小批带标签的合成图像作为试制,供你查看。一旦准备好,就可以使用逼真的物理引擎进行渲染,通过虚拟世界中的传感器捕获场景图像,图像也是自动标记的。”
新的合成数据生成功能和服务扩展了AWS已经相当广泛的AI产品组合。AWS提供了多种旨在简化神经网络开发的服务,还通过 等产品提供预打包的机器学习功能,用于自动生成产品推荐。