数据集:使用定义的源创建数据集
模型:制作预测模型
预测:基于模型生成预测
集成:创建各种模型的集成
评估:针对验证集的非常模型
官方网站:
Cloud
Cloud 是机器学习套件产品的一部分,可以帮助非ML专业人员构建高质量的机器学习模型。Cloud 使得训练图像识别模型变得更加简单,用户只需要通过拖拽操作就可以上传图像、训练模型和部署模型。
官方网站://
并不是一款机器学习或建模工具,其主要用于数据清洗和数据准备。提供了可视化指导,用户可以轻松地将数据汇集到一起,并进行查询、修复、清洗、共享等操作。与文中其他工具一样,使用无需具备编码或脚本能力。目前,已经开始涉足金融、消费品和互联网领域。如果你的工作包含数据清理,那么是一个很好的工具。
平台遵循以下流程:
添加数据:可以广泛地获取数据源。
探索:使用强大的可视化效果进行数据探索。
清理+更改:使用插补等步骤执行数据清理,使用NLP对相似值进行规范化,检测重复项。
形状:制作数据枢纽并执行分组和聚合。
分享+治理:允许在强大的身份验证和授权的情况下进行分享和协作。
组合:通过专利技术,允许将数据帧与1次点击组合在一起,并自动检测出最佳组合,同时多个数据集可以组合成一个。
BI工具:可以在常用的BI工具中轻松实现数据可视化,还可以实现数据预处理与可视化之间的迭代。
官方网站:
是另外一家专注于数据准备的创业公司,提供了非常直观的GUI来进行数据处理操作。对于每一列,都会自动推荐一些可以通过单击进行选择的转换,也可以使用一些预定义的函数对数据执行各种转换,这些函数可以在界面中轻松调用。主要用于金融、生命科学和电信行业。目前该产品提供了三个版本:
:一款免费的独立软件,允许处理最大100MB的数据。
Pro:上述的升级版本。允许单用户和多用户,数据量限制为40GB。
:的最高级产品。其对处理的数据量没有任何限制,并允许无限制的用户,非常适合大型组织。
平台遵循以下使用步骤:
发现:快速了解数据和分布情况。
结构:为数据分配合适的形状和变量类型,并解决异常。
清理:进行插补、文本标准化等过程,这些都是使数据模型准备就绪所必需的。
充实:这一步有助于提高分析质量,通过添加更多来源的数据或对现有数据执行一些功能来完成。
验证:对数据执行最终检测。
发布:将数据导出以供进一步使用。
官方网站:
是加州大学伯克利分校的AMP(算法机器人)实验室开发的一个开源项目。其背后的核心思想是为机器学习应用于大规模问题提供一个简单的解决方案。
包含3个产品:
MLlib: Spark中的核心分布式ML库。 它最初是作为项目的一部分开发的,但现在Spark社区也在支持它。
MLI:用于特征提取和算法开发的实验性API,它引入了高级ML抽象编程。
ML优化器:旨在自动执行ML管道构建任务。优化器通过包含在MLI和MLlib中的特征提取器和ML算法来解决搜索问题。
官方网站:
Auto-WEKA
Auto-WEKA是一个用Java编写的数据挖掘软件,由新西兰怀卡托大学的机器学习小组开发。这是一个基于GUI的工具,对数据科学初学者非常有用。最重要的是,Auto-WEKA是完全开源的,开发者已经提供了详细的使用教程和论文帮助你更好的使用它。目前Auto-WEKA主要用于教育和学术研究。
官方网站:
cs.ubc.ca/labs/beta///
AI
AI是由开源机器学习平台h2o.ai推出的最新产品,这一工具可以帮助非技术人员准备数据,审校参数,确定最优算法,进而用机器学习来解决专门的企业问题。该产品旨在降低数据科学在企业环境下运行的门槛。
这些是 AI的一些令人振奋的功能:
多GPU对,GLM和K-Means等的支持,即使对于大型复杂的数据集也能提供出色的训练速度。
自动特征工程,用于调整和综合各种模型以产生高度准确的预测。
在训练过程中,用于解释模型以及实时特征重要性的面板。
官方网站:
Azure ML
Azure ML 是一个简单而强大的基于浏览器的ML平台,其拥有可视化的拖放环境,不需要编码。微软已经为新手准备了非常全面的教程和应用示例,以帮助用户快速掌握该工具。Azure ML 的使用步骤非常简单:
导入数据集
如有必要,执行数据清理和其他预处理步骤
将数据分解为训练和测试集
内置的ML算法来训练模型
评分你的模型,并得到预测结果
官方网站:
MLJar
同Azure ML 一样,MLJar也是一个基于浏览器的平台,用于快速构建和部署机器学习模型。MLJar的操作界面非常直观,并允许用户并行训练模型。MLJar具有内置的超参数搜索功能,可以更轻松地部署模型。同时,MLJar提供了与的CUDA、以及等的集成。
MLJar的主要操作步骤:
上传数据集
训练和调整机器学习算法,并选择最佳算法
使用最佳模型进行预测并分享您的结果
目前该工具采取订阅付费模式,同时也提供免费版本(0.25GB的数据集限制)
官方网站:
Lex
Lex提供了一个易于使用的控制台,可以帮助用户在几分钟内构建属于自己的聊天机器人。用户可以使用Lex在自己的应用程序或网站中构建会话界面。你需要做的就是提供一些短语,剩下的都可以交给 Lex!其构建了一个完整的自然语言模型,使用该模型,客户可以使用语音和文本与应用程序进行交互。
Lex还与亚马逊网络服务(AWS)平台进行了集成,Lex是一项完全托管服务,随着用户参与度的增加,您也无需担心配置硬件和管理基础架构。
官方网站:/cn/lex/
IBM
如何从这个清单中排除IBM?这个世界上最知名的IT品牌之一。IBM 为构建和部署机器学习和深度学习模型提供了一个出色的平台。借助 ,你可以轻松完成数据准备工作、使用等熟悉的开源工具、访问最流行的库、训练深度神经网络等。对于机器学习的入门者来说,IBM提供了一系列的教程视频帮助你入门 。
官方网站:
/cloud/-