去年,我参加了GigaOm的Structure Data会议,这次会议的主题是关于Hadoop,大数据和非结构化数据的承诺,这对于标题为“ structure”的事件而言具有讽刺意味。今年的活动(3月19日至20日)更多地涉及可交付成果,包括案例研究,用户体验以及对大数据大计划的实际期望范围。从承诺到现实的转变值得欢迎。这是活动第一天以来我的五个最佳收获。
1.大数据和Hadoop类型的基础架构的部署既涉及技术,也涉及流程。关于客户的大数据湖填充大量数据,然后试图弄清楚该如何处理,“ H脚”只是one语。这个词来自前火箭科学家,现在是特纳广播公司分析师高管科林·科尔曼。
他指的是建立基于Hadoop的数据基础结构然后将所有形式的数据转储到系统中的诱惑,而没有大量计划是否需要数据,如何提取需要的内容以及提取数据后如何分析数据。
过去的商业智能技术专家应注意:急需人才,而不仅仅是在您学习交易的平台上。更好的案例研究是围绕开发人员获得自上而下的批准来重新考虑其公司如何使用数据和数据的方法,其中包括来自MetLife的一项引人注目的隐私保护计划,以及福特计划使用开源使开发人员根据大量汽车数据创建新应用程序。然后获得在通常的新产品规限之外进行操作的自由。
2. Hadoop仍然不是那么容易实现。在与MetaScale的讨论中以及在Alpine Data Labs的演示中,重点是采取(或至少掩盖了复杂性)并使非结构化数据更容易由需要答案的业务主管来积累,集成和查询。
不幸的是,Hadoop获得了可以满足您所有数据需求的神奇术语的光环。今年很明显,Hadoop及其相关模块正在迅速发展成为一个平台,该平台对客户具有很大的吸引力,但仍然需要平台在企业中成功运行所需的属性。
安全性,易于学习的工具以及与现有公司系统的挂钩都在不断发展,但目前还没有完全成熟。Alpine Data Labs产品副总裁Steve Hillion表示:“ [Hadoop]将脱离科学项目领域,并开始产生切实可行的有价值的见解和分析。