云手机会是出路吗?
|
HyperOpt HyperOpt 是一个用于贝叶斯优化的 Python 库,由 James Bergstra 开发。该库专为大规模优化具有数百个参数的模型而设计,显式地用于优化机器学习 pipeline,并可选择在多个核心和机器上扩展优化过程。 但是,HyperOpt 很难直接使用,因为它非常具有技术性,需要仔细指定优化程序和参数。相反,作者建议使用 HyperOpt-sklearn,这是一个融合了 sklearn 库的 HyperOpt 包装器。 具体来说,HyperOpt 虽然支持预处理,但非常关注进入特定模型的几十个超参数。就一次 HyperOpt sklearn 搜索的结果来说,它生成了一个没有预处理的梯度提升分类器:
如何构建 HyperOpt-sklearn 模型可以查看源文档。它比 auto-sklearn 复杂得多,也比 TPOT 复杂一点。但是如果超参数很重要的话,它可能是值得的。 自动机器学习(Automated Machine Learning, AutoML)是一个新兴的领域,在这个领域中,建立机器学习模型来建模数据的过程是自动化的。AutoML 使得建模更容易,并且每个人都更容易掌握。 在本文中,作者详细介绍了四种自动化的 ML 工具包,分别是 auto-sklearn、TPOT、HyperOpt 以及 AutoKeras。如果你对 AutoML 感兴趣,这四个 Python 库是最好的选择。作者还在文章结尾文章对这四个工具包进行了比较。 auto-sklearn auto-sklearn 是一个自动机器学习工具包,它与标准 sklearn 接口无缝集成,因此社区中很多人都很熟悉该工具。通过使用最近的一些方法,比如贝叶斯优化,该库被用来导航模型的可能空间,并学习推理特定配置是否能很好地完成给定任务。 该库由 Matthias Feurer 等人提出,技术细节请查阅论文《Efficient and Robust Machine Learning》。Feurer 在这篇论文中写道: 我们提出了一个新的、基于 scikit-learn 的鲁棒 AutoML 系统,其中使用 15 个分类器、14 种特征预处理方法和 4 种数据预处理方法,生成了一个具有 110 个超参数的结构化假设空间。
auto-sklearn 可能最适合刚接触 AutoML 的用户。除了发现数据集的数据准备和模型选择之外,该库还可以从在类似数据集上表现良好的模型中学习。表现最好的模型聚集在一个集合中。 关于机器人流程自动化(RPA),任务挖掘的一些最佳功能是能够从其记录的用户中提取击键级别的动作,揭示流程中的变体,生成实际指标以及输出构建流程定义所需的已定义流程的屏幕截图的能力。 流程定义文档(PDD)必须逐步准确地显示机器人应该做什么,因此它不应仅基于屏幕截图。仍然需要有关流程的其他知识,例如了解正在制定的业务决策,时间安排和其他约束条件。在完成流程定义文档(PDD)之前,仍然需要分析师与SME一起清理所有详细信息。 在评估流程的投资回报率(ROI)时,必须对任务挖掘工具执行相同的操作,因此,这里有一些主要注意事项:
显然,通过任务挖掘,对业务用户的干扰减少了,企业可以看到实际的指标数据和他们的工作的屏幕截图。这种方法确实节省了一些步骤,从而提供了更准确的指标和了解流程实际的窗口。但是,这并不能完全避免最初的挑战,即花费时间来了解中小企业的流程知识。 追求价值 流程挖掘并不是真正意义上的为机器人流程自动化(RPA)计划提供流程发现好处,但是,如果企业已经拥有这样的工具,则可以利用其流程管理和改进分析功能来发现自动化机会。任务挖掘虽然对于概述任务序列及其度量非常有益,但不会自动生成完整的流程定义文档(PDD)。它将帮助企业更快地到达那里,并提供更广泛的过程覆盖。
最终,企业必须评估使用任何任务挖掘解决方案的时间/成本收益。考虑一下可扩展性以及需要多长时间才能完成评估-与获得相同功能和输出所需的资源进行比较。无论采用哪种方法,企业仍然需要了解其业务。这些工具无法告诉企业从哪里开始,都要确保自己有一个良好的计划,最重要的是确保可以展示价值。 (编辑:盐城站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |


