【公测中】阿里云发布国内首个大数据双活容灾服务,满足高要求大数据灾备场景...

news/2024/7/7 18:32:30

在6月上旬举行的云栖大会上海峰会上,阿里云发布了国内首个大数据集群双活容灾产品-混合云容灾服务下的混合云大数据容灾服务(HDR for Big Data, 简称 HDR-BD),并已经在7月份开始邀测。HDR-BD采用业界领先的数据双向实时复制技术,可以实现Hadoop集群双活和准0 RPO容灾,为大数据灾备制定了全新的标准。

常见Hadoop灾备技术的挑战

当前比较常见的Hadoop集群灾备方式是用distcp将数据定期复制到一个备用集群做容灾用途,或者将数据复制到只读集群、二级存储作为多恢复点的备份。这些方案都有明显弱点。

RPO和RTO是衡量灾备方案的两个重要指标,RPO-恢复点目标,决定了丢失多少数据,RTO-恢复时间目标,决定了业务中断了多长时间。由于传统的Hadoop集群灾备方式使用的是distcp来做容灾,也就意味着数据复制不是实时的,因此用户必须承受至少小时级到天级的RPO。并且主站宕机后,将只读集群或二级存储中的数据恢复出来会占用大量时间,而拉起standby集群重新启动业务依然是一个耗时的操作。因此,传统的Hadoop集群灾备方式在RPO和RTO方面都有较大挑战。

除此之外,由于灾备集群平时处于备用状态,不能用于运行业务,对于用户来说也属于资源浪费。

以上这些问题长期困扰着Hadoop集群的用户和管理员们,如何突破RPO和RTO瓶颈,大数据集群的灾备领域亟需一种全新的技术来彻底解决目前的困境。

HDR- BD此次带来的双向实时复制技术可以在两个Hadoop集群之间建立双活架构,RPO接近0;RTO因为数据随时可读写而极大压缩;双活架构可以让两个集群运行不同的应用,避免资源浪费。这些特性将Hadoop灾备标准提高到了一个全新的高度,为Hadoop用户带来了极高的价值。

HDR-BD引入大数据双向复制技术,满足高要求的大数据灾备场景

阿里云此次推出的Hadoop双活容灾方案HDR-BD引入了业界领先的大数据双向复制技术,结合强大的公共云基础设施,可以满足极高要求的大数据灾备场景,为企业Hadoop集群数据保护提供了全新的选择。
HDR-BD的优势在于:

极低RPO:数据的实施复制决定了每一个写操作都会实时复制到配对集群,RPO几乎为0
极高资源利用率:数据双向复制确保两个集群共享一份数据但运行不同应用,不会出现一个集群必须处于只读会备用状态的问题,计算资源可以充分利用
运维复杂度极低: HDR-BD实现了数据的全自动实时双向复制,无需特定时间窗口,也无需担心对业务的影响
1【公测中】阿里云发布国内首个大数据双活容灾服务,满足高要求大数据灾备场景

在自建数据中心和阿里云之间部署HDR-BD服务器配对,用户就可以将自建Hadoop集群与阿里云无缝集成,充分利用阿里云EMR和OSS建立极为高效的Hadoop灾备,迁移系统。HDR-BD可以满足的核心场景包括

近0 RPO Hadoop云容灾
将自建Hadoop集群的数据实时复制到阿里云EMR集群,实现接近0 RPO的Hadoop集群容灾。
Hadoop集群与阿里云EMR集群双活
在自建Hadoop集群和阿里云EMR集群之间建立数据双向复制。两个集群共享一份数据,但是运行不同的应用,实现集群双活,达到资源的最大化利用。
Hadoop数据实时备份,迁移上云
云上HDR-BD服务器可以直连至阿里云对象存储OSS。在无需EMR集群的情况下,HDR for Big Data可以将Hadoop数据实时复制到阿里云OSS,实现接近0 RPO的云备份;同时这个机制也可以作为Hadoop数据迁移上云的理想方案。利用这个机制做Hadoop集群迁移上云,在迁移过程中无需启动EMR集群;同时迁移过程无需复杂定制化脚本开发或者复杂的业务停机规划。
该服务现已开始邀测,您可以到阿里云混合云容灾服务页面https://cn.aliyun.com/product/hdr 注册,阿里云在评估后会尽快联系您。

转载于:https://blog.51cto.com/13927391/2161280


http://lihuaxi.xjx100.cn/news/271452.html

相关文章

python37对应jdk_PYTHON3 之 环境搭建(JDK-SDK-Python3-PyQt5-PyCharm-PyInstaller)

一、安装JAVA JDK1、安装JAVA JDK1)JAVA JDK下载地址:2)安装目录2、配置环境变量1)新建一个系统环境变量,变量名为JAVA_HOME,变量值为JDK的安装路径,如下图所示:2)在系统变量列表中,双击Path变量&#xff0…

COJN 0575 800601滑雪

800601滑雪难度级别:B; 运行时间限制:1000ms; 运行空间限制:51200KB; 代码长度限制:2000000B 试题描述Michael喜欢滑雪百这并不奇怪, 因为滑雪的确很刺激。可是为了获得速度&#xf…

php 爬虫去重,浅谈动态爬虫与去重(续)

作者:Fr1day0keeTeam0x00 前言在 浅谈动态爬虫与去重 中,分享了动态爬虫中触发事件、监控节点变动、URL去重等的实现方法。在接近一年的线上运行与迭代更新过程中,处理了很多bug,也遇到一些有趣的漏抓案例。本文将详细分析几个有代…

GBDT和GNN结合,结果怎么样?

选自OpenReview作者:Sergei Ivanov等机器之心编译编辑:小舟、蛋酱GBDT 和 GNN 方法各有各的优势,现在,来自法国、俄罗斯两家机构的研究者将二者的优势结合起来,探索使用 GBDT 模型处理图结构数据。论文地址&#xff1a…

考考基础部分,谈谈Java集合中HashSet的原理及常用方法

点击上方“方志朋”,选择“设为星标”回复”666“获取新整理的面试文章作者:工匠初心cnblogs.com/LiaHon/p/11257805.html目录 HashSet概述HashSet构造add方法remove方法遍历合计合计先看一下LinkedHashSet在看一下TreeSet总结一. HashSet概述 HashSet是…

通过 Python 代码实现时间序列数据的统计学预测模型

来源 | DeepHub IMBA封图 | CSDN 付费下载于视觉中国 在本篇中,我们将展示使用 Python 统计学模型进行时间序列数据分析。 目标是:根据两年以上的每日广告支出历史数据,提前预测两个月的广告支出金额。原始数据:2017-01-01 到 201…

干货|神经网络及理解反向传播

点击上方“小白学视觉”,选择加"星标"或“置顶”重磅干货,第一时间送达一、人工神经网络简述下面开始说神经网络。注意,当我们说N层神经网络的时候,我们没有把输入层算入(因为输入层只是输入数据&#xff09…

python selenium xpath_python+selenium十四:xpath和contains模糊匹配

xpath可以以标签定位,也可以任意属性:如:以input标签定位:driver.find_element_by_xpath("//input[idkw]")如:type属性:driver.find_elements_by_xpath("//input[typetext]")一、xpath…