010-68421378

sales@cogitosoft.com

中文版English

其他语言版本

当前您所在的位置：首页>新闻中心>行业动态

为什么选择 MapR Data Science Refinery？

发布时间：2018/05/15 浏览量：6335

为什么选择 MapR Data Science Refinery? 可以访问所有数据因而有更准确的见解 MapR Data Science Refinery是唯一可以安全访问所...

为什么选择 MapR Data Science Refinery?

可以访问所有数据因而有更准确的见解

MapR Data Science Refinery是唯一可以安全访问所有数据的数据科学产品。它用以下东西连接盒子:

MapR-XD: 用于文件和容器

• 全球分布式数据存储

• 高规模，且可靠

MapR-DB：高度可扩展的多模型NoSQL数据库管理系统

• 支持多种数据模型，包括宽列，文档，键值和时间序列。

MapR-ES: 全球发布 - 订阅事件流媒体系统

• 融合数据平台内置的第一个大数据规模流媒体系统

• 唯一可以在物联网规模上可靠地支持全球事件复制的大数据流系统

创建实时机器学习管道

MapR平台的核心组件是MapR-ES，它是一个针对大数据的全球发布 - 订阅事件流媒体系统。通过MapR-ES和机器学习库的本地集成，企业现在可以创建实时机器学习管线，使他们能够将ML模型应用于实时数据。

通过广泛的语言和图书馆支持提高数据科学的生产力

MapR数据科学精炼厂提供了Apache Zeppelin数据科学笔记本，可以在一个视觉空间中跨越多个引擎工作:

• 使用Apache Spark和Python进行分布式计算和ML编程

• 使用Apache Hive和Drill的批处理和交互式SQL

• Apache Pig的脚本支持

• Shell 访问 MapR-FS

• 使用Spark编程访问MapR-DB和MapR-ES

使用持久和有状态的容器轻松部署

容易部署

• Docker Hub上有Docker镜像。

• Image包含了所有必要的功能，不再需要使用MapR作为集装箱化应用程序的持久数据存储。

安全

• 身份验证发生在容器级别，以确保容器化的应用程序只能访问授权的数据。

• 加密通信以确保在访问MapR中的数据时的隐私.

可扩展

• Dockerfile也将在GitHub上提供，允许您根据需要进一步自定义图像以支持您的特定应用程序需求。

持久

• 容器可以轻松地利用所有的MapR平台服务（MapR-FS，MapR-DB，MapR流）作为持久数据存储。

为数据科学家提供强大的可视化支持

MapR数据科学精炼厂配备了8个开箱即用的可视化库，包括MatPlotLib和GGPlot2。Apache Zeppelin提供了一个可插入的可视化框架使得:

• NPM注册表中提供常见的可视化库

• 轻松创建和加载自定义可视化的功能

启用笔记本/模型协作，共享和镜像

MapR融合数据平台非常适合存储模型和笔记本存储库。组织可以利用MapR平台的全局名称空间和卓越的复制功能。MapR平台还提供了不变的快照，以保存和部署相同模型的各种版本，从而使数据科学家能够比较每个版本模型的性能和准确性。

下一篇：你的业务是怎么从MapR Data Science Refinery 获得收益？

上一篇：The MapR Data Science Refinery：可扩展的数据科学工具包

京ICP备09015132号-996 | 违法和不良信息举报电话：4006561155

© Copyright 2000-2026 北京哲想软件有限公司版权所有 | 地址:北京市海淀区西三环北路50号豪柏大厦C2座11层1105室

北京哲想软件集团旗下网站：哲想软件 | 哲想动画

公司新闻|联系我们