如果您相信一些大数据专家预测的结果,那么2019年很可能会成为一个能够重新引起人们对数据湖的兴趣的一年。私有云也可能卷土重来。其他与数据相关的大数据预测包括混合成为事实上的一般环境,大数据被整合为“小数据”,透明度成为关键的AI要求。
该细分市场的另一位专家认为“开发人员会重新审视他们的应用程序对数据的影响,因为他们必须让这些部署将数据传输到其他业务部门以供他们使用。对于拥有大量数据的企业而言混合云服务,传统和现代应用程序以及要解决的大业务问题,数据问题将成为首要问题。“
这是2019年新一年之前的一系列eWEEK预测文章的最新内容。
Waterline Data的创始人兼首席技术官Alex Gorelik :
现在已经证明,AI和ML将深入挖掘企业: “在2018年,我们看到一直在推动组织内部大数据计划的时间,成本和劳动密集型手动流程开始消失。自动化,AI和ML现已证明,不仅在速度方面而且在准确性方面 - 现在正在应用于越来越多的业务功能。这符合将硬编码业务流程和操作转移到软件中的一般趋势 - 并调整人员和物理操作以匹配预定义和严格的业务流程 - 并动态调整业务流程和操作以适应物理现实历史学习。
“例如,大学正在衡量历史录取和接受趋势,以确定谁可能接受录取以及奖学金会对他们的决定产生多大影响。正在进行替代信用风险分析,以确定首次或低收入借款人的信誉。社交媒体的情绪分析正在收集流失预测。所有这些应用的关键是能够创建良好的稳定模型,建立良好稳定模型的关键是能够找到正确的数据并创建正确的功能。2019年, AI和ML将在寻找和理解构建这些模型所需的数据方面发挥重要作用。“
向混合环境问好: “去年,我预测云的广泛采用将最终迫使对象存储加强并妥善管理,并且新标准将需要数据治理,即云,位置和平台无关。在2019年,您将看到更多组织现在对云划分感到满意,这是一种混合的异构数据产业,其中包括多个适合用途的大数据,内部部署和云端的关系数据和NoSQL数据存储。有了混合模型,在公共云上运行最佳的应用程序就可以驻留在那里。那些需要留在本地的人可以这样做。虽然这似乎会带来更大的复杂性,但在2019年,您会看到越来越多的解决方案通过位置和计算透明度来提取这种复杂性。
这是数据湖的巨大回报:“虽然传统上组织一直专注于创建和保护数据湖的机制,但经常创建数据沼泽,2019年将重新关注数据湖的采用。这与我们在数据仓库方面的经历非常相似,其中数据仓库的初始生成经常被误导并且缺乏采用,但他们向组织传授了创造价值和实现广泛采用所需的真正需求。我相信我们处于数据湖泊的同一阶段,并且在2019年,重点将从数据湖的机制转向使湖泊中的数据可以大规模地以自动化方式发现,可用和管理,这是由新的AI驱动的数据目录和治理解决方案。即使是新的数据湖,也会以更加谨慎的方式推出,并有明确的初始用例,使用和治理政策。随着越来越多的组织开始采用跨越多个系统的虚拟数据湖,我们还将看到更多数据湖正在构建或迁移到云以利用托管基础架构,弹性存储和计算以及丰富的生态系统。
大数据变得很少数据: “不,组织不会倾销他们数据的所有库存,但是,他们将在有限的范围内。随着对数据的更大可见性,他们将有机会合理化和整合以显着节省存储成本,甚至更准确的分析,因为组织知道哪些数据已损坏且可以被抛弃。但是,由于编目等关键流程的自动化,“变得很小”也会说明大量的数据,这些数据过去常常使组织变得易于管理。
可解释性将成为关键的AI要求: “随着越来越多的业务(和政府)使用AI和ML算法运行,将更加关注透明度和可解释性。抵押贷款为什么被拒绝?银行是否可以证明没有任何非法人口统计数据(如种族,性别等)被用于做出决定或培训做出决定的模型。找到适当的数据集并记录其谱系和质量是实现这种透明度和可解释性的第一步。如果我们不知道数据来自何处或意味着什么,我们将无法解释该模型或确保其正确合法的运作。“
SIOS Technology总裁兼首席执行官Jerry Melnick:
技术进步将使云更适合关键应用: “随着IT员工现在对关键应用程序的云变得越来越熟悉,他们对安全性和可靠性的担忧,特别是对于5到9的正常运行时间,已经大大减少了。最初,组织更愿意使用他们当前在其数据中心中使用的任何高可用性故障转移群集技术来保护迁移到云的关键应用程序。此聚类技术还将进行调整和优化,以增强云中的操作。与此同时,云服务提供商将继续提升其提供更高服务水平的能力,从而使云最终成为所有企业应用的首选平台。
动态利用率将使HA和DR对更多应用程序更具成本效益,进一步推动向云迁移: “凭借其遍布全球的几乎无限的资源,云是提供高正常运行时间的理想平台。但是,配置大多数时间闲置的备用资源对于许多应用来说成本过高。跨多个区域和区域部署的流体云资源日益复杂,所有这些都通过高质量的网络互联连接,现在只需在需要时动态分配备用资源,这将大大降低配置高可用性和灾难恢复保护的成本。
云将成为SAP部署的首选平台。“随着云服务提供商提供的平台不断成熟,他们托管SAP应用程序的能力将变得具有商业可行性,因此具有战略重要性。对于CSP,SAP托管将成为确保与企业客户长期合作的一种方式。对于企业而言,“SAP-as-a-Service”将是一种在不牺牲性能或可用性的情况下充分利用云中规模经济的方法。“
云 “快速启动”模板将成为复杂软件和服务部署的标准。“快速启动模板是基于向导的界面,它使用自动脚本来动态配置,配置和编排运行特定应用程序所需的资源和服务。它们的主要优点包括减少培训要求,提高速度和准确性,以及最大限度地减少甚至消除人为错误作为主要问题根源的能力。通过使部署更加交钥匙,快速启动模板将大大减少DevOps员工设置,测试和推出可靠配置所需的时间和精力。“
高级分析和人工智能将无处不在,包括基础架构运营: “高级分析和人工智能将简化IT运营,提高基础架构和应用程序的稳健性,并降低总体成本。随着这一趋势,人工智能和分析将嵌入高可用性和灾难恢复解决方案,以及云服务提供商产品,以提高服务水平。通过快速,自动和准确地理解问题并诊断复杂配置中的问题,从云提供的关键服务的可靠性和可用性将大大提高。
Atos North America金融服务首席数字官Justin Yunag :
由于成本和控制,公共云用户将转回私人网站: “迁移到公共云的呼吁曾经是公司可以支付更少的费用并更多地控制数据。然而,两者都已成为技术决策者的抑制因素。2019年将是收回公司所有权的一年。在公共云中,还有许多额外的成本。例如,数据的入口可能是免费的,但云提供商会为离开网络的每兆字节收费。这意味着出口的缓慢滴落加快了。就私有云而言,云提供商每月提供统一费率,这有利于成本预算。此外,长期保留数据使公共云暴露于频繁的SEC审计,导致企业失去对数据的控制。总体而言,公共云中的设计,功能和成本可能处于更高的难度,
DataStax开发者关系副总裁Patrick McFadin :
混合/多云世界中未来企业的需求: “越来越多的公司希望推出混合和多云应用,但他们也必须考虑混合云数据。要做到这一点,这是一项艰巨的任务。我认为2019年将是人们不再仅仅关注应用程序组件而是考虑更广泛的应用程序基础架构问题的一年。数据方面难以解决,特别是如果您想避免被锁定到公共云提供商选项中。
“开发人员会重新审视他们的应用程序对数据的影响,因为他们必须让这些部署将数据传输到其他业务部门供他们使用。对于混合云服务,传统和现代应用程序以及需要解决的大型业务问题的企业来说,数据问题将成为首要考虑因素。