在介绍新的之前,需要认识一下“前辈”。最初的系统是作为一个实验开发的,用于回答智力竞赛节目《危险边缘》中的问题!2011年,计算机系统与冠军Brad 和Ken 竞争,击败了人类赢得了100万美元一等奖(IBM将奖金全部捐给慈善机构)。
在硬件方面, 集群由90台IBM 服务器组成,每台服务器都有一个3.5GHz 处理器;该系统提供了2880个处理器线程和16TB的RAM。
经过数十亿美元的投资,进一步发展并创建健康,但并未获得成功。2022年1月,据报道,IBM以10亿美元的价格将 出售给私募股权公司 。
基础上的建筑
构建像、Bard或Llama这样的人工智能系统需要时间和资源。这些庞大的大型语言模型(LLM)源于互联网上的信息,可以回答许多不同主题的复杂问题,但缺乏特定的知识。设想这些基础LLM是一座建造良好的房子。基本设施包括窗户、墙壁、楼梯、门、房间、壁橱和通道,但不存在家具。有人可能会问,“我如何从客厅到楼上的浴室?”LLM会回答这个问题。它可能会在房子里提供不同的(答案)路径,但它会让你到达目的地。
但如果有人问“客厅的平板电视有多大?”模型就会迟疑。这些信息是特定于特定家庭的,因此需要用有关您家庭的信息来增强基础模型。需要给房子添置家具。
为基础模型提供更多特定于领域的数据可以拓展广泛使用的途径。当然,要求写一篇关于战争与和平的文章,或者提供代码来乘以两个矩阵,都是令人印象深刻的,但要求写一份300字的关于去年销售数字的报告是行不通的。
添加家具意味着专门为您的组织或业务调整模型。这个过程引入了许多“基础问题”,这些问题可能对新模型的成功具有相当重要的意义。例如,
我应该使用什么基础模型?
如果基础提供了有偏见的答案呢?
如果我的训练数据有偏差怎么办?“
正如这些问题所表明的那样,将人工智能与领域知识结合起来需要仔细考虑数据的提供和质量。
认识
2023年5月,IBM推出了。将描述为下一代或进化版可能很方便,但事实上,与几乎没有直接关系。旨在帮助GenAI(生成式人工智能)技术席卷几乎所有市场领域。也就是说,将帮助回答上述类型的问题。
有以下三个主要组件。这些组件提供了先进的机器学习、数据管理和生成式人工智能功能,以快速、可信的数据和治理在整个业务中训练、验证、调整和部署人工智能系统。它有助于促进整个数据和人工智能生命周期,从数据准备到模型开发、部署和监控。
.ai允许用户轻松地训练、验证、调整和部署生成人工智能、基础模型和机器学习功能,并用小部分数据在尽量短的时间内构建人工智能应用程序。
.data是人工智能项目的开放式(数据湖屋)存储解决方案,提供无缝的数据传输和管理。它为数据提供了一个单一的入口点,而不考虑位置,并允许实时或批处理,所有这些都在一个强大的治理框架的背景下进行。
是一个端到端的治理解决方案。它涵盖了整个人工智能生命周期的数据来源,确保了可追溯性、透明度、可解释性和偏差检测。
银行业应用挑战
IBM全球产业和金融服务的执行架构师兼首席全球行业工程师Jen 谈到了银行业的,虽然大多数企业在某个时候需要解决现代化问题,但银行业面临着增加收入、降低成本和寻找增长机会的压力。
银行业面临的挑战之一是COBOL应用程序的持续使用。COBOL是第二古老的高级编程语言(最古老的是),也是许多银行和金融机构的支柱。COBOL仍然在使用,因为它可以工作,并且应用程序是牢固可信的。然而,也存在一些问题。首先是COBOL程序员的短缺。第二是需要在编程语言中使用现代特性和功能来应对新挑战。包括超个性化服务在内的新银行方法需要支持复杂分析的现代工具。银行面临着现代化或建立新系统以满足其需求的压力。
生成式人工智能为这些挑战提供了一条前进的道路。关于使用将代码从一种语言翻译成另一种语言的报道令人印象深刻。然而,这些成功案例通常是基于小例子,可能需要进一步审查才能在生产环境中获得信任。
代码翻译的难题正是发挥作用的地方。基于.ai基础模型,IBM开发了代码助手(Code for Z),该助手使用了经过微调的编码模型,使开发人员更容易逐步实现COBOL业务服务的现代化,并选择性地转换为高质量的Java代码。此外,使用,开发人员可以获得对现有COBOL代码的见解和建议,即便没有原始作者的知识。
Code for Z允许用户使用他们的标准和最佳实践来调整和自定义底层基础模型。同时,数据源归属将为生成代码的潜在来源提供透明度。
当将COBOL转换为Java时,生成的Java代码是“人类可读的”,允许开发人员修改或增强生成的代码。为了为新代码提供信心和验证,将自动生成现有COBOL和新Java代码的测试用例。
可追溯性、透明度、可解释性和偏差检测等属性是组件的一部分,该组件允许组织创建开放和可观察的转换过程。随着人工智能监管的兴起,端到端的数据来源将对受监管行业的风险管理和合规至关重要。
不仅仅针对COBOL
提供严格的代码转换不仅限于银行业。几乎每个部门都有需要可靠的现代化或转换的代码。
另一个应用程序IBM Code 是生成式人工智能服务,它可以帮助开发人员更高效地创建(这是新出现的自动化运维工具,基于开发)内容。Red Hat 助手阅读用户输入的简明英语,然后与IBM 基础模型交互,为自动化任务生成代码建议,然后用于创建行动手册。结果是用YAML代码编写的,并遵循经验丰富的用户公认的最佳实践。 助手减少了对高技能开发人员的需求。
需要注意的是, Code for Z是代码助手产品系列的新成员,与IBM Code for Red Hat 一起。这些解决方案由IBM的.ai代码模型提供支持,该模型预计将拥有115种编码语言的知识,并从1.5万亿个token中学习。它有200亿个参数,有望成为代码自动化最重要的生成式人工智能基础模型之一。 Code 产品组合将随着时间的推移而扩展,以解决其他编程语言的问题,提高现代化的价值实现时间,并解决开发人员日益增长的技能挑战。
未来,将遗留的应用程序转换为Java、C甚至可能很快就会实现。