Google Cloud Platform支持R编程语言


R语言最常用于数据分析工具和统计应用程序。为了在Google Cloud Platform(GCP)上为R编程语言提供额外支持,Google宣布在Cloud Dataproc上发布Spark测试版。据谷歌称,云计算的兴起为R开辟了新的机遇。

Google Cloud Platform支持R编程语言

“使用GCP for R可以避免以前用于限制理解数据的基础设施障碍,例如选择要计算的数据集,因为计算或数据大小限制。借助GCP,您可以构建大型模型来分析以前需要在高性能计算基础架构上进行巨额前期投资的大小数据集,“机器学习专家Mikhail Chrestkha在博客文章中说。

Cloud Dataproc是针对GCP上的Apache Spark和Apache Hadoop集群的托管云服务,而SparkR是一个轻量级软件包,它在前端实现了来自R的Apache Spark,该公司解释说。

Crosbie和Chrestkha写道,“这种集成让R开发人员可以对存储在云存储中的几乎任何大小的数据集使用类似dplyr的操作。 SparkR还支持使用MLlib进行分布式机器学习。您可以使用此集成来处理大型云存储数据集或执行计算密集型工作。“

linuxboy的RSS地址:https://www.linuxboy.net/rssFeed.aspx

本文永久更新链接地址:https://www.linuxboy.net/Linux/2018-12/155971.htm

相关内容