自动机器学习
编辑自动机器学习(AutoML)是将机器学习应用于现实世界问题的任务自动化的过程。自动机器学习有可能包括从原始数据集开始到建立机器学习模型准备部署的每个阶段。AutoML是作为一种基于人工智能的解决方案被提出来的,以应对应用机器学习这一日益严峻的挑战。AutoML的高度自动化旨在让非专业人士利用机器学习模型和技术,而不要求他们成为机器学习的专家。将机器学习端到端的应用过程自动化,还可以产生更简单的解决方案,更快地创建这些解决方案,而且模型的性能往往优于手工设计的模型。AutoML中使用的常见技术包括超参数优化、元学习和神经架构搜索。
与标准方法的比较
编辑在一个典型的机器学习应用中,从业者有一组输入数据点,用于训练。原始数据的形式可能不是所有的算法都能适用的。为了使数据适用于机器学习,专家可能必须应用适当的数据预处理、特征工程、特征提取和特征选择方法。在这些步骤之后,从业者必须进行算法选择和超参数优化,以最大化其模型的预测性能。如果使用深度学习,神经网络的架构也必须由机器学习专家来选择。这些步骤中的每一个都可能具有挑战性,导致使用机器学习的重大障碍。AutoML旨在为非专家简化这些步骤,并使机器学习的实践更加有效。最难实现自动化的任务是数据清洗,因为在原始数据及其格式中"任何东西"都有可能。
自动化的目标
编辑自动化的机器学习可以针对机器学习过程的各个阶段。自动化的步骤有。数据准备和摄取(来自原始数据和杂项格式)栏目类型检测;例如,布尔型、离散数字型、连续数字型或文本栏目意图检测;
例如,目标/标签、分层字段、数字特征、分类文本特征或自由文本特征任务检测;例如。二元分类、回归、聚类或排名特征工程特征选择特征提取元学习和迁移学习检测和处理倾斜数据和/或缺失值模型选择--选择使用何种机器学习算法。通常包括多个相互竞争的软件实现Ensembling--一种共识的形式,使用多个模型往往比任何单一的模型得到更好的结果学习算法的超参数优化和特征化在时间、内存和复杂度的限制下选择管道评估指标和验证程序的选择问题检查泄漏检测误配置检测分析获得的结果创建用户界面和可视化界面
内容由匿名用户提供,本内容不代表vibaike.com立场,内容投诉举报请联系vibaike.com客服。如若转载,请注明出处:https://vibaike.com/175473/