功能特性

多数据源支持

可对接多种数据源,允许存储任意规模的结构化、半结构化、非结构化数据,同时可以按原样存储数据。

计算弹性

通过计算与存储分离,实现计算资源的弹性伸缩,满足客户对计算资源的灵活调度。

成本最优

为集中式存储池,可快速扩展或缩减存储资源,实现存储数据冷热分层,降低大数据分析与机器学习存储成本。

服务集成

无缝支持腾讯云各类计算分析、机器学习产品,包括弹性 MapReduce、 流计算 Oceanus 、腾讯云 TI 平台机器学习。

业务架构

方案概述

对象存储 COS 可存储任意规模的结构化、半结构化、非结构化数据,其提供12个9的数据持久性,实现计算与存储分离,发挥计算弹性伸缩能力,同时对存储数据冷热分层,是构建数据湖的首选存储服务。借助 COS 构建的数据湖,搭配数据湖加速器 GooseFS、元数据加速器、AZ 加速器等加速服务,可以高效、低成本地对接各类计算分析和机器学习平台,从而打破数据孤岛,洞察业务价值,指导客户做出更好的决策。

典型应用场景

  • 开源生态数据湖
  • 交互式查询数据湖
  • 混合分层模式数据湖
  • 机器学习数据湖
  • 云原生数据湖

场景描述

客户基于开源 Hadoop 生态构建大数据处理与分析,会面临计算资源与存储资源扩容速度不匹配、存储系统需对接多数据源的问题。

主要能力

  • 计算存储分离:通过计算与存储分离,实现计算资源弹性伸缩,满足客户对计算资源的灵活调度。
  • 多数据源支持:可对接多种数据源,允许存储任意规模的结构化、半结构化、非结构化数据。
  • 高性能业务架构:通过数据湖加速器 GooseFS、元数据加速器、AZ 加速器等多级加速服务,提升计算业务访问性能。
咨询行业专业顾问
关于使用场景和技术架构的更多咨询, 请联系我们的销售和技术支持团队。


http://www.vxiaotou.com