人工智能(A I)的工作有一个讽刺之处:它涉及大量的手工、尝试和错误的努力,以建立最高精度的预测模型。 随着机器学习和深度学习框架的不断出现,以及对它们的更新,以及对工具平台的更改,难怪如此多的人工智能工作是如此的临时性。 但是,为什么一个关于自动化的技术会涉及这么多定制的努力呢?
所有手工工作的问题有两个:第一,没有数据科学培训的人几乎不可能从事人工智能工作;第二,具有数据科学背景的人本身面临着一个非常低效的工作流程。
然而,随着自动机器学习(AutoML)的出现,这种僵局现在开始变得清晰起来。 一些公司,如数据机器人,专门从事它。 其他AI创业公司,如Dataiku、H20和Rapid Miner,以及Tibco等已建立的企业软件公司,也拥有广泛的AI平台,具有AutoML功能。 主要的公共云平台也是如此,包括Micros of tAzure、AmazonWeb服务和GoogleCloud平台。 还有开源的AutoML框架,如Auto-sklearn、Auto-Keras和Uber最近的开源Ludwig平台。
汽车ML看起来比时尚多得多。 事实上,我在AI市场上交谈过的一些人认为AutoML可能是AI整体的未来。 只要你有一个干净的数据集,你知道它中的哪一列是“标签”(a.k.a目标),即你想用新数据预测的值,AutoML将为你建立一个模型,并大大减少努力。 而且,有时,你会得到你的模型,根本没有额外的努力。
考虑到这一点,我认为一个入门的东西可能是有序的,这篇文章是我试图提供一个。 免责声明:虽然我自80年代以来一直是AI的追随者,90年代末以来一直是数据挖掘系统的爱好者,但我不是数据科学家。 因此,我的词汇和解释在教学上并不权威----在某些情况下,它们可能是天真的。 但我在这里得到的东西应该能帮助你理解AutoML平台的能力,我希望它能帮助你判断市场上的产品和框架。