新算法可帮助科学家连接来自多个来源的数据点,以解决高风险问题

2020-05-07 17:29:25    来源:新经网    作者:冯思韵

开源图形机器学习库StellarGraph今天推出了一系列用于网络图形分析的新算法,以帮助发现数据中的模式,使用更大的数据集并提高性能,同时减少内存使用量。

新算法可帮助科学家连接来自多个来源的数据点,以解决高风险问题

StellarGraph通过其数据科学部门Data61隶属于澳大利亚国家科学机构CSIRO 。

欺诈和网络犯罪等问题非常复杂,涉及来自许多来源的紧密连接的数据。

数据科学家在处理关联数据时面临的挑战之一是如何理解实体之间的关系,而不是查看孤岛中的数据,以提供对问题的更深入的理解。

StellarGraph Library团队负责人Tim Pitman说,解决巨大的挑战需要比更简单的算法所允许的更广泛的上下文。

“将数据捕获为网络图,使组织能够了解他们要解决的问题的全部内容,无论是执法,了解遗传疾病还是欺诈检测。”

StellarGraph库提供了用于图形机器学习的最新算法,为数据科学家和工程师提供了在其自身的网络数据上构建,测试和试验强大的机器学习模型的工具,使他们能够查看模式并帮助应用他们的研究解决了跨行业的现实世界问题。

“我们为数据科学家开发了一个功能强大,直观的图形机器学习库,该库使最新的研究可以访问,从而解决了许多行业的数据驱动型问题。”

CSIRO Data61团队的1.0版发布了三种新算法到库中,支持图分类和时空数据,此外还提供了一种新的图数据结构,从而显着降低了内存使用量并提高了性能。

从时空数据中发现模式和知识变得越来越重要,并且对许多现实世界的现象具有深远的影响,例如交通预测,空气质量,甚至可能是传染病的移动和接触追踪,这些问题适合于深度学习框架,可以从跨时空收集的数据中学习。

新的图分类算法的测试包括试验训练图神经网络以预测分子的化学性质,这些进展可能使数据科学家和研究人员能够找到抗病毒分子来抵抗感染,例如COVID-19。

库提供广泛的功能和增强的性能是三年来交付可访问的,领先的算法的工作的高潮。

皮特曼先生说:“此版本中的新算法将库开放给需要解决的新类型问题,包括欺诈检测和道路交通预测。

“我们还使该库更易于使用,并致力于优化性能,使我们的用户可以处理更大的数据。”

StellarGraph已被用于成功预测阿尔茨海默氏症的基因,提供先进的人力资源分析和检测比特币勒索软件,并且作为Data61研究的一部分,该技术目前正被用于基于基因组标记物预测小麦种群特征,这可能会改善基因组学选择策略以增加谷物产量。

该技术可以应用于跨行业,政府和研究领域的网络数据集,并且已经开始探索将StellarGraph应用于复杂的欺诈,医学图像和运输数据集。

CSIRO Data61小组负责人调查分析负责人Alex Collins说:“组织面临的挑战是从其数据中获取最大价值。使用网络图分析可以开辟新的方式来告知高风险,高影响力的决策。”

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。