评估数据生产率工具中嵌入式AI的机会

2020-01-13 13:59:32    来源:    作者:

AI换AI越来越受到关注-但是是否会忽略嵌入AI以提高数据生产力的能力?让我们直截了当地查看行业专家的观点。

在BCG亨德森研究所(BCG Henderson Institute)最近的一篇文章中,“ 如何用人工智能取胜”中,作者提出了一个问题:

评估数据生产率工具中嵌入式AI的机会

在众多投资人工智能的公司中,有一个令人惊讶的独家集团:从AI创造价值的公司。而且,至少到现在,反对被录取的可能性是发人深省的。据2500名多名高管的调查-为进行新的报告由麻省理工学院斯隆管理评论,BCG伽玛和BCG亨德森学院-十家企业的七人报告很少或没有收益从他们的AI行动为止。为什么有些努力成功了,而更多的失败了?

在新的报告由麻省理工学院斯隆管理评论,BCG伽玛和BCG亨德森学院提供六点建议,以改善该组织可以与AI成功率:

将AI策略与业务策略整合

将收入增长优先于降低成本

承担具有重大影响的大型项目-即使它们具有风险

使AI的生产与AI的消​​费保持一致

将AI视为主要的业务转型工作

投资于AI人才,数据治理和流程变更

这很明显。唯一让我震惊的是#3。并不是说它是如此新颖,而是作者对仍然是一个备受争议的问题表示了立场:目标高,但起点低,而起点低。我不会认为#3是给定的。这取决于太多因素。

人工智能悄然取得了可验证和有益进展的领域之一不是应用程序。在应用程序管道的另一端,我们看到了嵌入在流程中的AI的迅速扩展:管理,解释和配置信息。

评估数据生产率工具中嵌入式AI的机会

关键是,用于数字转换和创建面向客户的应用程序的AI比将嵌入式AI集成到工具中要困难得多。这是双赢的,因为未能提供干净且可用于AI的数据是缺少进度的最常见的原因。这样做,以推动AI通过所需的规模和节奏准备数据已经成为一项不人道的任务。利用AI为AI做准备; 它听起来很优美。

在福布斯(Forbes.com)上浏览Gil Press的一篇文章,《2020年AI预测120种》,我对此想法有所支持。(注意:文章中只有60条评论,我想这是第1部分)。我将这些作为示例。这不是完整的行业调查。以下是受访者的一些亮点以及我的反应。

Trifacta的联合创始人兼首席运营官Joe Hellerstein。Joe是加州大学伯克利分校的计算机科学教授,他的工作重点是以数据为中心的系统及其驱动计算的方式。他是ACM研究员,Alfred P. Sloan研究研究员,并且由于他的研究获得了两个ACM-SIGMOD“时间测试”奖。Hellerstein认为AI在数据背后的作用:

还期望看到数据准备方面的投资有所增加,而数据准备是任何数据项目中不可或缺的组成部分,仍然经常被视为许多项目的最大瓶颈,这将推动数据质量的提高,并使IT摆脱准备数据的压力。

李浩远,Alluxio创始人兼首席技术官:

过去的统计模型现在已经与计算机科学融合,并已成为AI和机器学习。因此,数据,分析和AI团队不再相互孤立。他们需要合作并共同努力,以从他们都使用的相同数据中获取价值。2020年,我们将看到更多的组织围绕数据堆栈建立专门的团队。

MyPOV:他们将使用带有AI辅助开发的工具。这些专门的团队将需要大大减少他们为数据管理,版本控制,一键式访问算法(或张量)而编写的代码量。AI / ML对于AI工程师的工作效率没有得到足够的重视。

Virtana首席执行官Philippe Vincent :

……企业……将需要基于AIOps的解决方案,该解决方案将基础架构监视,工作负载自动化和容量规划集成到一个平台中。因此,无法采用AIOps服务模型的供应商和未能在端到端基础架构可见性方面进行投资的企业将无法实现客户要求和性能SLA。

MyPOV:好主意,但并没有真正谈论AI。

Qlik全球市场情报主管高级总监Dan Sommer :

现在比以往任何时候都更容易进行数据库内索引和分析,并且我们拥有确保数据可以移到正确位置的工具。数据的神秘性消失了:2019年Hadoop分销商的整合和快速消亡标志着这一转变的信号。下一个重点领域将是非常分散的或“广泛的数据”。数据格式变得越来越多样化和碎片化,结果,适用于各种数据风格的不同类型的数据库增加了一倍以上。

MyPOV:如果没有具有嵌入式机器学习,深度学习和NLP的工具,任何人都无法组织这个smorgasbord。

Genpact首席数字官Sanjay Srivastava :

我们将看到数字道德官员的崛起,他们将负责实施道德框架以做出决策。这包括安全性,偏见,预期用途和内置治理

MyPOV:这是唯一提及道德的评论;否则,与主题无关。我只是想指出六十位预测者中有五十九位被忽略了,而一件事将在2020年变得炙手可热。

智库首席营销官兼企业传播负责人Yaffa Cohen-Ifrah :

人工智能使保险公司能够更好地利用他们掌握的大量数据,以从至关重要的客户洞察中受益,从而最大程度地提高其服务和产品。这样可以使客户满意并提高业务效率。

MyPOV:实际上,这取决于哪种类型的保险公司。长尾风险(例如人寿保险)具有老化应用程序中的数据,记录了40年,五十年或更久的历史。利用这些“数据宝库”非常困难,并且对于使用AI的解决方案(使语义上的困难混合合理化)已经成熟。

Qentelli总裁Sanjay Jupudi:

2020年将更多地关注可解释的AI,以减少预测中的任何偏差。数据科学家将成为产品团队不可或缺的一部分,并与他们紧密合作,以数据为先的方法开发应用程序,而不是专注于理解由应用程序生成的数据

MyPOV:我不完全理解他所说的“数据优先”的含义,但是我认为它暗示了AI通知的数据管道,这很好。

Talend首席技术官兼首席运营官Laurent Bride :

无论是用于自动执行重复性任务(数据准备等),还是通过来自您和您的同行的上下文信息来连接管道,人工智能都将开始渗透到业务功能的所有领域。

MyPOV:我不相信其他人提到管道。制药公司GSK在公开演示中证明,所有临床试验数据的合并均使用StreamSets精心策划的10,000多个管道进行,但我没有明确听说StreamSets在其产品中使用AI,但我怀疑它们确实这样做了。

软机器人首席执行官Carl Vause :

关于人工智能,仅仅因为组织内存在数据并不意味着数据是可用的,可传输的格式。2020年将是企业开始了解其数据尚未支持AI的一年,这将使其业务流程效率低下,效率低下或不准确。

值得注意的是,一些将AI注入其DataOps和/或信息集成产品的技术提供商的示例是:

Informatica:Informatica于3年前推出,它宣布了一种名为CLAIRE的产品,该产品据称是其大量产品平台中注入的一组AI功能。我花了差不多几年的时间才或多或少地了解他们在做什么。CLAIRE现在是具有工程师,市场营销和管理专职的独立产品,它提供AI(ML,各种类型的神经网络,NLP)来支持整个产品平台。

UnifiSofware(现在是Boomi的一部分):Unifi OneMind AI技术是功能的基础,从数据准备和数据目录建议到发现类似数据集,再到自然语言查询支持。它基于知识图,采用递归卷积神经网络,隐马尔可夫模型和基因测序算法。

Trifacta将自己描述为“数据争吵者”(到目前为止,这不是一个官方的技术术语,但也许要关注这个领域)。它结合了机器学习和人工操作来查询和组织数据以产生各种见解。

Paxata(现在是DataRobot的一部分)Paxata具有类似AI的功能,尽管未明确描述为AI引擎。它具有自动发现相关数据准备项目和数据集并自动创建多项目数据流的能力。不用说,被认为是AI公司的公司DataRobot将为Paxata的数据集成和目录功能添加AI。

Tamr:Tamr使用机器学习的主要地方有两个:实体合并(重复数据删除)和实体分类。一个有趣的方面是,当最初没有足够的训练数据来建立模型时,Tarr会使用强化学习。实体分类(记录分类)是一个包含ML部分的多步骤过程。

评估数据生产率工具中嵌入式AI的机会

我拿

有关AI的大量对话涉及人员,应用程序和自动化,这是应用程序培训的结尾。人工智能为列车的无形部分提供动力的机会正在逐渐成熟,并将为人工智能的成功(失败)体验提供推动力。

也许与我的建议有点相切,哈克农恩认为:

当将AI应用于我们开发应用程序的方式时,它将改变我们用来管理基础结构的方式。AIOps将取代DevOps,并使您的IT部门员工能够进行精确的根本原因分析。此外,这将使您立即轻松地从海量数据集中找到有用的见解和模式。大型企业和云供应商将受益于DevOps与AI的融合。

我不得不问Irfan Ahmed Khan,DataOps发生了什么事情,这似乎很快就来了,但是我想AIOps只是更智能的DataOps。

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。