010-68421378
sales@cogitosoft.com
当前您所在的位置:首页>新闻中心>行业动态

为什么选择 MapR Data Science Refinery?

发布时间:2018/05/15 浏览量:4063
为什么选择 MapR Data Science Refinery? 可以访问所有数据因而有更准确的见解 MapR Data Science Refinery是唯一可以安全访问所...

为什么选择 MapR Data Science Refinery?

可以访问所有数据因而有更准确的见解

MapR Data Science Refinery是唯一可以安全访问所有数据的数据科学产品。它用以下东西连接盒子:

MapR-XD: 用于文件和容器

• 全球分布式数据存储

• 高规模,且可靠

 

MapR-DB:高度可扩展的多模型NoSQL数据库管理系统

• 支持多种数据模型,包括宽列,文档,键值和时间序列。

MapR-ES: 全球发布 - 订阅事件流媒体系统

• 融合数据平台内置的第一个大数据规模流媒体系统

• 唯一可以在物联网规模上可靠地支持全球事件复制的大数据流系统

 

创建实时机器学习管道

MapR平台的核心组件是MapR-ES,它是一个针对大数据的全球发布 - 订阅事件流媒体系统。通过MapR-ES和机器学习库的本地集成,企业现在可以创建实时机器学习管线,使他们能够将ML模型应用于实时数据。

 

通过广泛的语言和图书馆支持提高数据科学的生产力

MapR数据科学精炼厂提供了Apache Zeppelin数据科学笔记本,可以在一个视觉空间中跨越多个引擎工作:

• 使用Apache Spark和Python进行分布式计算和ML编程

• 使用Apache Hive和Drill的批处理和交互式SQL

• Apache Pig的脚本支持

• Shell 访问 MapR-FS

• 使用Spark编程访问MapR-DB和MapR-ES

使用持久和有状态的容器轻松部署

 

容易部署

• Docker Hub上有Docker镜像。

• Image包含了所有必要的功能,不再需要使用MapR作为集装箱化应用程序的持久数据存储。

 

安全

• 身份验证发生在容器级别,以确保容器化的应用程序只能访问授权的数据。

• 加密通信以确保在访问MapR中的数据时的隐私.

 

可扩展

• Dockerfile也将在GitHub上提供,允许您根据需要进一步自定义图像以支持您的特定应用程序需求。

 

持久

• 容器可以轻松地利用所有的MapR平台服务(MapR-FS,MapR-DB,MapR流)作为持久数据存储。

 

为数据科学家提供强大的可视化支持

MapR数据科学精炼厂配备了8个开箱即用的可视化库,包括MatPlotLib和GGPlot2。Apache Zeppelin提供了一个可插入的可视化框架使得:

• NPM注册表中提供常见的可视化库

• 轻松创建和加载自定义可视化的功能

 

启用笔记本/模型协作,共享和镜像

MapR融合数据平台非常适合存储模型和笔记本存储库。组织可以利用MapR平台的全局名称空间和卓越的复制功能。MapR平台还提供了不变的快照,以保存和部署相同模型的各种版本,从而使数据科学家能够比较每个版本模型的性能和准确性。

下一篇:你的业务是怎么从MapR Data Science Refinery 获得收益?
上一篇:The MapR Data Science Refinery:可扩展的数据科学工具包

                               

 京ICP备09015132号-996网络文化经营许可证京网文[2017]4225-497号 | 违法和不良信息举报电话:4006561155

                                   © Copyright 2000-2023 北京哲想软件有限公司版权所有 | 地址:北京市海淀区西三环北路50号豪柏大厦C2座11层1105室

                         北京哲想软件集团旗下网站:哲想软件 | 哲想动画

                            华滋生物