为什么选择 MapR Data Science Refinery?
可以访问所有数据因而有更准确的见解
MapR Data Science Refinery是唯一可以安全访问所有数据的数据科学产品。它用以下东西连接盒子:
MapR-XD: 用于文件和容器
• 全球分布式数据存储
• 高规模,且可靠
MapR-DB:高度可扩展的多模型NoSQL数据库管理系统
• 支持多种数据模型,包括宽列,文档,键值和时间序列。
MapR-ES: 全球发布 - 订阅事件流媒体系统
• 融合数据平台内置的第一个大数据规模流媒体系统
• 唯一可以在物联网规模上可靠地支持全球事件复制的大数据流系统
创建实时机器学习管道
MapR平台的核心组件是MapR-ES,它是一个针对大数据的全球发布 - 订阅事件流媒体系统。通过MapR-ES和机器学习库的本地集成,企业现在可以创建实时机器学习管线,使他们能够将ML模型应用于实时数据。
通过广泛的语言和图书馆支持提高数据科学的生产力
MapR数据科学精炼厂提供了Apache Zeppelin数据科学笔记本,可以在一个视觉空间中跨越多个引擎工作:
• 使用Apache Spark和Python进行分布式计算和ML编程
• 使用Apache Hive和Drill的批处理和交互式SQL
• Apache Pig的脚本支持
• Shell 访问 MapR-FS
• 使用Spark编程访问MapR-DB和MapR-ES
使用持久和有状态的容器轻松部署
容易部署
• Docker Hub上有Docker镜像。
• Image包含了所有必要的功能,不再需要使用MapR作为集装箱化应用程序的持久数据存储。
安全
• 身份验证发生在容器级别,以确保容器化的应用程序只能访问授权的数据。
• 加密通信以确保在访问MapR中的数据时的隐私.
可扩展
• Dockerfile也将在GitHub上提供,允许您根据需要进一步自定义图像以支持您的特定应用程序需求。
持久
• 容器可以轻松地利用所有的MapR平台服务(MapR-FS,MapR-DB,MapR流)作为持久数据存储。
为数据科学家提供强大的可视化支持
MapR数据科学精炼厂配备了8个开箱即用的可视化库,包括MatPlotLib和GGPlot2。Apache Zeppelin提供了一个可插入的可视化框架使得:
• NPM注册表中提供常见的可视化库
• 轻松创建和加载自定义可视化的功能
启用笔记本/模型协作,共享和镜像
MapR融合数据平台非常适合存储模型和笔记本存储库。组织可以利用MapR平台的全局名称空间和卓越的复制功能。MapR平台还提供了不变的快照,以保存和部署相同模型的各种版本,从而使数据科学家能够比较每个版本模型的性能和准确性。
京ICP备09015132号-996 | 网络文化经营许可证京网文[2017]4225-497号 | 违法和不良信息举报电话:4006561155
© Copyright 2000-2023 北京哲想软件有限公司版权所有 | 地址:北京市海淀区西三环北路50号豪柏大厦C2座11层1105室