去年,随着SQL Server 2019的一般发布,Microsoft推出了大数据群集(BDC),供客户仅在Linux容器上运行。通过Kubernetes的支持,BDC提供了一个统一的平台,可以从结构化和非结构化数据中发现见解。
今天,已发布SQL Server 2019 的最新累积更新。该版本被称为CU5,带来了许多新功能,特别着重于扩展BDC提供的功能。
简而言之,这些是已完成的更改:
支持在Red Hat OpenShift Kubernetes平台上部署BDC。
以非root用户身份启用了BDC中正在运行的应用程序。
支持针对同一Active Directory域部署多个BDC。
丰富的数据虚拟化体验。
增强和开源的Spark SQL连接器。
杂项改进和错误修复。
在单独的博客文章中详细介绍了这些新功能。首先,OpenShift 4.3及更高版本将支持BDC部署。BDC的安全设计经过专门升级,以适应OpenShift容器平台。微软的SQL团队已经与Red Hat紧密合作,以使这些更改成为可能。继续前进,所有受支持的平台现在将确保默认情况下,在BDC上运行的容器应用程序以非root用户身份启动。CU5之前的BDC部署将不受此更改的影响。
同时,新的数据虚拟化功能包括引入两个存储过程,即sp_data_source_objects和sp_data_source_ columns。这些 可以用于查找需要虚拟化的表,以及用于通过T-SQL发现架构的方法。现在也可以在企业环境中利用多个BDC部署,以“适应开发/测试,预生产或生产,CI / CD管道或HADR等多个用例”。
最后,适用于Apache Spark的SQL Server和Azure SQL Connector已在ApacheV2许可下开源。计划在连接器上线时发布更多的更新。