查看: 1805|回复: 0

英伟达发布开源机器学习平台,数据科学用上GPU加速了

[复制链接]

665

主题

1234

帖子

6670

积分

xdtech

Rank: 5Rank: 5

积分
6670
发表于 2019-3-16 11:21:48 | 显示全部楼层 |阅读模式
Nvidia发布名为RAPIDS的机器学习平台,其包含的软件函数库可以让数据科学家方便的使用GPU的计算能力,执行端到端的数据科学以及分析工作,RAPIDS使用CUDA进行低阶计算最佳化,并提供Python界面方便数据科学家使用GPU的高性能计算能力。


RAPIDS的目的是要提供企业高性能计算能力,以解决需要处理大量数据的高度复杂问题,如信用卡盗刷、预测库存或是了解消费者的购买行为。Nvidia创始人黄仁勋提到,现今企业越来越依赖数据驱动,而数据分析以及机器学习现正是高性能计算的热门领域。
开源的RAPIDS是一套基于GPU分析的CUDA加速函数库,可用来执行机器学习以及数据视觉化,目前现阶段提供了五个热门机器学习函数库,并加上了GPU加速,如此便能更快的迭代并最佳化人工智能训练,以获得更好的模型准确度。
RAPIDS是Nvidia和开源社区花费两年共同打造的平台,Nvidia表示,这是第一次为数据科学家提供在GPU上执行数据科学工作所需要的完整工具。该平台使用XGBoost机器学习算法,在Nvidia DGX-2TM系统上进行训练,其实验结果显示,与仅使用CPU的系统相比,速度提升了50倍。这将能让模型训练时间从数天缩短到数小时,数小时下降至数分钟。
RAPIDS建立在热门的开源项目上,包括了Apache Arrow、Pandas和Scikit-learn,并在Python数据科学工具链中加入了GPU加速。而且为了增加RAPIDS的功能,黄仁勋提到,Nvidia有多个相关项目正在进行,正与Anaconda、BlazingDB、Databricks、Quansight和Scikit-learn等开源生态贡献者合作。
Apache Spark技术团队所创立的企业Databricks创始人Matei Zaharia表示,他们对RAPIDS能够加速Apache Spark工作负载感兴趣,现在正进行多个计划,以便整合Spark与原生加速器,其中包括对Apache Arrow的支持。Databricks认为,RAPIDS将能扩展企业在数据科学以及人工智能方面的工作负载。
RAPIDS获得一系列大型科技公司的支持,其中包括甲骨文透过Nvidia Cloud在Oracle Cloud Infrastructure上支持RAPIDS,并且也将在Oracle Data Science Cloud中支持。而IBM也宣布将在企业机房、公有云、混合云和多云环境中,透过IBM Cloud、PowerAI和IBM Watson Studio支持RAPIDS。Nvidia还提到,惠普、思科、戴尔和联想也都将在自家系统支持RAPIDS。


回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

快速回复 返回顶部 返回列表