Data.world连接数据和人。这是我们对data.world大约一年前发布其企业平台的报道的要点。Data.world已经取得了巨大的成功,今天它正在引入Capsenta将事情提升到一个新的水平。
简而言之,data.world使用知识图(又称关联数据,又名语义Web)技术的超级大国来整合数据集,并为企业提供数据管理和协作平台。Capsenta拥有专利技术,可帮助整合数据源(主要是关系数据源),并使其可作为知识图表访问,无论是在内部还是在云中。
这两家公司已经合作了一段时间,它们不仅在技术上匹配,而且在文化上也是如此。ZDNet与data.world首席执行官兼联合创始人Brett Hurt和Capsenta创始人Juan Sequeda进行了讨论,后者将担任data.world的首席科学家。
通过虚拟知识图集成数据
赫特提到,最近的收购浪潮证明了数据和分析正在成为企业的核心要素。他接着补充说,数据。世界的产品在企业中非常受欢迎,包括四大专业服务公司和十大美国投资银行等客户。
其中一些客户处于高度监管的行业,例如医疗保健或金融,有时这会带来挑战。Data.world运行云服务,可以提取和编目数据,元数据或两者。在受监管的行业中,将数据移动到云可能不是一种选择。这是Capsenta的Ultrawrap数据集成软件的用武之地。
Sequeda十多年来一直致力于知识图谱虚拟化,他非常了解这项技术的优势和劣势。知识图和SPARQL查询语言是数据集成和编目方案的理想选择。正如Sequeda所说,问题在于SPARQL在某些方面试图重新发明轮子:
“我们拥有超过30年积累经验的关系技术,为什么不重用这个?”。因此,Capsenta的技术所做的就是充当SPARQL和关系数据源之间的桥梁。查询在SPARQL中制定,利用其支持许多不同数据源的能力,然后在SQL中进行翻译和执行,其中这些数据源是关系型的。
可以保持原样,而摄取的元数据可以用于使其成为跨越许多数据的知识图的一部分在内部和云端都有来源。Sequeda指出,Capsenta的解决方案增加了可忽略的开销,有效地使云中SPARQL的执行时间等于SQL内部的执行时间。
正如赫特提到的那样,data.world已经与Capsenta合作了大约一年半。最初,Capsenta是data.world的合作伙伴,但是大量的企业客户意味着可以使用Capsenta技术的用例激增。反过来,这使得联合力量成为下一步,正如赫特和塞奎达所说的那样,“感觉我们应该一直在一起工作”。
通过消费者级UI构建知识图
这意味着没有太多的集成要做,因为大部分它已经存在。但虚拟知识图并不是Capsenta带给桌面的唯一东西。Data.world是关于其技术堆栈的声音,但同时希望让最终用户看不到它。他们称之为消费级用户界面(UI)是其中的关键部分,而Capsenta的Gra.fo是完美的匹配。
Gra.fo是一个视觉知识图编辑器,Capsenta大约在3年前开始以隐身模式工作。构建知识图并非完全不复杂。部分原因与底层数据模型的复杂性有关。虽然市场上有一些用于构建知识图的可视化工具,但Sequeda觉得缺少了某些东西。