背景需求
行业大数据分析与人工智能应用面临较大的瓶颈和制约,行业缺少AI技术人才,AI建模技术门槛高、大量依赖专家经验,建模周期长、成本高、效率低。为了能让更多普通行业和企业完成大数据智能化分析,加速大数据与AI应用落地,迫切需要一种高效易用的自动化AI建模方法和工具,减少对AI人工专家的依赖,提高AI建模效率。
产品介绍
江苏鸿程大数据研究院研发成功一套自动化机器学习与AI建模工具平台,内置了南京大学PASA大数据实验室自主原创、国际先进的技术,用户仅需给定数据和预算时间,无需人工干预,平台即可自动化实现机器学习流水线的自动化设计,将数据预处理、特征选择、模型选择以及超参数调优等步骤,交由平台自动完成,从而实现AI模型的自动化构建。平台支持传统机器学习和深度学习的自动化建模,并可面向宽表、多表、图像、语音、文本、时序数据等不同数据类型完成自动化建模。在模型性能不低于人工专家的前提下,能够大幅提高AI建模效率,从而降低AI使用门槛,让AI为人人所用。
平台架构
应用案例
问题:转炉炼钢模型建立
目标:通过构建转炉炼钢模型预测出炉钢铁的达标率
命中率传统机器学习建模:
进行特征预处理和特征工程的操作;
划分数据集为训练集和测试集;
选择一个机器学习算法及其参数训练;
进行模型预测和评估;
如果评估不达标,更改参数或重新选择模型继续训练
自动化建模
设置指定时间,全流水线自动化的选择特征预处理、特征工程、机器学习模型及其参数
功能特性
自动化建模功能丰富
支持机器学习流水线全过程自动化设计,支持分类、回归、聚类算法模型自动化特征选择、模型选择和参数 调优,支持深度学习网络结构自动化搜索
多数据类型自动化建模
除通用化的自动化建模能力外,支持宽表、多关系表、时间序列数据、图像、语音、文本等多种不同类型数据的自动化建模,进一步提高建模精度
技术原创,建模性能优异
性能优于已有的开源系统,并多次在国际大赛中获奖,核心技术原创且国际领先,产品技术已应用于华为、360等企业
落地化系统,扩展性强
技术先进的落地产品,可集成不同计算平台及AI算法,支持、Spark MLlib、-learn、等各种开源的人工智能算法平台
方便高效,简捷易用
可与可视化编程平台集成使用,可在拖拽式可视化编程环境中自动化选择算法模型和参数,也可提供简单易用的编程API,供代码编程调用