浅谈如何实现云计算时代的数据备份

(整期优先)网络出版时间:2022-06-07
/ 3

浅谈如何实现云计算时代的数据备份

蔡仁诚

杭州容错科技有限公司

摘要:大数据、云计算、虚拟现实技术的发展,改变了传统数据存储模式。由于云计算是依托网络云将数据计算程序分解为多个小程序,然后通过多部服务器构成的系统将处理的小程序结果反馈给用户,可以在短时间完成大量的数据计算处理。这种分布式计算方式需要依托云平台进行处理,由于云端系统结构复杂,采用虚拟的应用模式,多用户的应用环境以及海量的数据对数据备份提出了新的要求,如何在云计算时代确保数据备份的安全性成为互联网的特点话题。本文首先阐述了云计算的虚拟化、动态可扩展性、按需部署、成本低等特点,在这个基础上分析了云计算时代数据备份存在的问题,并从选择数据备份软件、本地数据备份、存储快照技术等几个方面分析了云计算时代的数据备份方式。

关键词:云计算;数据备份;数据恢复;数据安全

引言:

数据备份是为了避免系统出现操作失误、系统故障造成的数据丢失、泄露、篡改等问题,将全部或者部分数据集合从应用主机转移到硬件设备或者转移到其他存储介质。传统数据备份需要采用内置或外置的磁带机进行冷备份,这种备份方式只能适合系统操作失误造成的人为故障,恢复时间比较长。在网络信息时代,每天产生的数据信息超过过去几千年的总和,对数据存储提出了新的要求,传统的数据备份方式不适合信息时代的数据备份要求,网络技术的发展,促进了云存储技术的进步,云存储技术将数据直接在网络存储,也就是三方的虚拟服务器,个人和企业可以向第三方购买、租赁网络存储空间存放数据资料,用户根据自身需求及时查看、搜索、应用数据,降低了数据存储成本和维护成本。然而云时代的到来,为数据备份提供便利的同时,也增加了数据泄露的风险。2019年国内最大的云服务供应商,阿里云计算有限公司未经用户同意,将用户留存的注册信息泄露给第三方合作公司。根据IDC2020年的一项调查显示,超过80%的企业遭遇过云数据泄露,将近50%的企业数据遭到多次泄露[1]。在云计算时代,如何确保数据备份的安全性,避免数据丢失,保证数据的连续性和完整性,成为当下云存储备份技术遇到的主要问题。

1、云计算特点

云计算又称为网格技术,是一种分布式计算方式,在很短的时间完成数以万计的数据处理,从而提供强大的网络服务。关于云计算的含义,从狭义上来说,云计算是一种提供资源的网络,用户只要根据需求量付费后,随时通过网络按需获取“云”上的资源,并根据用户的需求,可以无限扩展容量。广义上的云计算是信息技术、软件、互联网等结合的一种技术服务,实现网络资源共享,这种计算资源共享池称为“云”,云计算是将大量的计算资源集合起来,并利用云计算软件对这些数据资源进行自动化管理,不需要大量人员进行维护,可以为用户快捷提供资源服务[2]。从这方面来说,云计算是一种商品,可以像水、电、天然气等一样,用户方便取用、价格低廉,让用户通过网络可以获得无限资源。与传统的网络应用模式相比,云计算具有以下特点:

1.1虚拟化

虚拟化是云计算最大特点,它打破了时间、空间的限制,采用分布式计算模式,以互联网为核心,将很多计算机资源整合在一起,让用户可以在网络上快速、安全获得云计算服务和数据存储服务,每一个使用网络的人都可以运用网络上提供的强大计算功能和网络数据。它的虚拟性包括应用虚拟和资源虚拟,硬件设备和应用环境与云计算在空间方面没有任何联系,虚拟平台自动完成终端设备的数据备份、迁移和扩展。

1.2动态扩展性

云计算具有强大的计算能力,可以在原来的服务器基础上增加云计算功能,让计算机快速分布式计算,并将计算结果合并。一旦数据信息超过原有系统容量,则系统可以在原来服务器的基础上增加云计算功能,则可以快速扩展容量,满足云计算虚拟空间对应用环境的扩展需求[3]

1.3按需部署

云计算包含了大量的小程序、应用系统,不同小程序和不同的应用系统对计算能力和应用的数据库的要求不同。因此,在运行过程中,云计算平台需要对不同用户的需求进行资源部署,根据用户的需求可以快速配备相应的计算能力和数据资源,满足用户需求。

1.4兼容性好

在信息时代,为满足各行各业信息系统建设的需求,目前市场上的软件、硬件、操作系统、云存储系统都支持虚拟化技术,虚拟化技术可以将云端共享资源池的数据信息进行统一管理。为满足不同用户对云计算的需求,云计算平台可以兼容不同计算机型号、不同生产厂家的硬件设备以及外部的高性能计算机。

1.5可靠性

云计算平台如果在运行过程中,计算机虚拟服务器出现故障,也不会影响到云计算平台的计算和小程序的运用。如果单点服务器出现故障,虚拟化技术可以自动恢复或修复分布在不同物理服务器的应用程序,或者利用云计算平台的动态扩展功能部署新的服务器开始进行计算[4]

1.6价格低

云计算平台将大量的数据信息存储在网络虚拟池进行统一管理,改变了传统数据存储方式,用户不需要采用硬件设备或存储设备将数据进行存储,而是直接将其存储到云端,降低了客户数据存储的成本。

2、云计算时代数据备份存在的问题

在信息时代,每天产生海量的数据信息,包括办公文档、文本、图片、动画、音频、视频、HTML等不同类型的数据,这些数据超过80%以上都是非结构化数据,非结构化数据没有预定义的数据模型,无法使用数据库二维逻辑表现数据,数据形式多样化,每年以60%指数增长。大规模数据增长对数据存储提出了新的要求,如何在保存不同类型数据的同时,挖掘这些数据蕴含的商业价值,为企业生产决策、市场营销、产业转型升级提供参考[5]。面对海量的数据信息,传统的数据保护技术已经无法满足云计算时代数据备份的要求。在云计算时代数据备份的安全性,成为当下思考的主要问题:

2.1虚拟化数据安全

在移动互联网时代,通过网络可以完成购物消费、娱乐、网络交易等活动,这些网络交易活动在云计算虚拟环境下进行,在网络交易过程中,可能涉及大量资金、银行账户、电话号码、地址等企业与个人敏感的信息。目前,大部分企业采用自动化办公,企业计算机安装了服务器或数据备份系统,员工在使用计算机的时候,系统自动将数据备份到云端。如果云端的这些数据信息被不法分子窃取,并通过一定的技术手段将这些云平台数据破解,对数据进行分析,可能造成大量用户数据信息泄露。不法分子窃取了云计算平台的数据信息进行违法交易,给云计算平台的用户造成巨大经济损失。在云计算时代,很多企业为了降低信息存储成本,将企业重要的数据信息存储在云端,一些黑客通过技术手段可以攻击云计算平台,破坏云计算安全平台,篡改、删除、添加云端数据信息。由于云端数据信息比较多,篡改了其中部分数据,后台工作人员没有及时发现,从而给云计算平台带来巨大损失。

2.2数据恢复的颗粒度

用户在使用云计算服务时,要求第三方对用户所托管的数据进行备份,避免一旦数据泄露,造成数据无法恢复。传统数据备份后,在查询数据的时候,需要将备份数据进行恢复,恢复后才能查询,恢复时间与存储定义文件大小有关,用户只能从恢复的文件中寻找自己所需的数据资料。如果数据比较大,则需要相当长的时间才能恢复,这一定程度上影响到用户的使用。云计算平台的数据存储量超过了过去传统备份硬件设备,因此如何快速找到云数据,并让数据快速恢复,是云计算平台数据备份面临的问题。由于云计算的虚拟性、动态扩展性,用户将数据托管在第三方服务商后,第三方服务商服务器存储了大量的用户信息,一旦云计算平台信息泄露后,需要通过备份技术或软件恢复原来的数据。数据颗粒度指在庞大的数据库中的某一个文件或附件,如何快速定位到相应的位置并提取所需内容,满足用户的数据信息使用要求[6]。在使用过程中,为了确保用户云端数据安全性,第三方服务商将企业的机密信息采用加密技术将数据隔离,虽然一定程度上确保了数据的安全性,但是用户在使用过程中,可能需要层层验证才能使用,这一定程度上影响到数据资源使用效率。

2.3数据恢复时效性

传统的数据一旦泄露,需要通过备份盘将数据进行恢复,如果用户的数据存储量比较大,则需要大量的时间恢复这些数据信息。在云计算平台,由于云计算平台要24小时在线满足用户在线交易需求,出现问题后不能停止云平台的运转,部分企业在线有业务恢复时效性可能只有几秒钟。因此,传统的数据恢复方式无法满足云计算时代的数据备份要求,云端数据一旦泄露,无法快速恢复数据成为数据备份面临的难题[7]。因此,在进行数据备份的时候,还要做好数据的灾害恢复测试,如果恢复时间过长,不适宜云端数据备份要求。

3如何实现云计算时代的数据备份

云计算时代对数据备份的安全性、数据恢复时效性等提出了更高的要求,在实施数据备份的时候,需要确保备份数据的安全性、完整性,进一步完善存储数据技术和备份技术。

3.1数据备份软件

数据安全性和保密性是云计算平台面临的主要问题,网络的共享性、公开性,为广大用户提供便利的同时,增加了数据泄露的风险,如果云计算平台的安全防护措施和保密技术不到位,则可能造成数据泄露。因此,在进行数据备份的时候,可以采用安全可靠的数据备份软件,这些数据备份软件公司专注于云计算存储技术,这方面有一定的经验和技术,并根据数据存储增量、大小等因素制定云储存方案[8]。目前的Veeam备份软件侧重灾害恢复、虚拟化管理和备份软件的开发。公司研发的Veeam备份软件是在虚拟环境开发的数据备份方案,为数据保护和灾难恢复提供支持。这套软件不需要安装在用户的操作系统中获取数据,而是利用VMware vSphere虚拟平台的快照功能,VMware vSphere虚拟平台将应用程序和操作系统从底层硬件系统分离出来,从服务器中直接完成资源池的管理。当云计算平台开始备份的时候,VMware vSphere会自动创建镜像指令,利用快照作为接下来存储的数据源。Veeam通过数据块的方式,将源数据存储设备复制VMware vSpher虚拟平台的数据,并将这些数据建压缩、复制,最后用备份软件专有格式存储在备份资源库。在备份软件中,数据备份其实是一个作业驱动的过程,为了完成备份作业,系统需要配置备份作用,备份作用自定义完成备份内容、方式、时间、存储位置。一个备份作业可以包括一个或多个备份指令,让备份按照计划自动完成工作。备份作用第一次运行过程中,产生的镜像是一个完整的备份,其他的备份作业则是增量备份,自动筛选不需要备份的数据,减少云端数据备份量。其次,这款软件还具备即时恢复功能,可以对虚拟服务器、整个虚拟平台共享数据资源进行即时恢复,利用备份软件自身强大的功能,自动执行灾害恢复流程,最快速度恢复数据,并在云端完成故障排除、测试系统补丁以及完成测试更新等工作,避免系统遭遇其他软件的攻击,确保了数据的完整性。此外,备份软件还集成了 Amazon KMS 、 Azure Key Vault 及 RBAC技术,简化对云端资源访问人员和内容的控制,提高了整个云端数据的安全性和可靠性。

3.2采用本地存储技术

云存储虽然可以完成数据备份,降低数据备份成本,但是由于云存储面临一定的网络安全风险,一旦泄露,将给企业造成巨大的经济损失。因此,在实现云存储的基础上,重要数据依然要做好本地数据备份,以免云端系统出现故障,数据无法正常使用[9]。因此,重要数据在采用云端备份的基础上,依然可以采用本地数据备份系统,一旦云端服务器出现故障,本地备份系统可以快速完成数据复制、迁移。目前,Bluehost公司提供的虚拟主机,访问速度比较跨,主机运行稳定,在Bluehost主机运行的域名用户超过500万个,是国内外非常受欢迎的虚拟主机,可以为用户提供免费的SSH访问权限和一年免费的国际域名。Bluehost主机经过二十多年的发展,逐渐形成了一定的规模,运行成本相对比较低,拥有超强固态硬盘云存储技术,DDOS硬件防火墙,不计量存储空间和流量,可以完成10G宽带接入,运行过程中不会受到国内电信网络、网通的速度限制,可以全天候为用户提供服务。目前,国内的阿里、百度等大型互联网公司都采用本地备份系统,将重要的数据存储在虚拟主机上,一旦云端存储出现故障,立即启动本地备份系统。

3.3存储快照技术

存储快照技术是指定数据集合的一种完全可用拷贝方式,拷贝的时候包括相应数据在某一个时间点的映像,它不仅可以是数据的复制品,也可以是数据的一个副本[10]。快照数据主要功能是完成在线数据的备份与恢复,如果存储设备发生故障或者云端存储数据遭到损坏的时候,存储快照技术可以快速修复数据,将数据恢复到原本可用的一个时间点的状态,并为存储用户提供了另外一个数据访问通道,如果原数据在线应用过程中,用户可以直接访问存储快照技术,并利用快照技术完成测试。存储快照技术作为数据备份的代替品,如果数据备份业务对前端运行造成影响,则快照存储技术可以将其备份工作转移到其他服务器完成,这样可以解决云端存储过程中出现的故障。

结束语:

大数据、云计算、物联网等现代信息技术的发展,促进了网络存储的发展。网络的开放性、共享性,增加了云计算存储的数据安全风险,数据存储安全性成为用户普遍关心的问题。在云计算时代,必须根据云存储的特点,采用数据备份软件、本地数据备份以及快照存储技术等,确保数据存储的安全性、完整性和可靠性。

参考文献:

[1]张倩. 大数据时代计算机网络信息安全管理分析[J]. 电脑知识与技术,2021,17(21):62-64.

[2]龚玮玮,黄建军. 计算机数据库备份和恢复技术的应用研究[J]. 数码世界,2020(9):14-15.

[3]马遥. 基于大数据及人工智能技术的计算机网络安全防御系统设计[J]. 信息与电脑,2020,32(4):208-209.

[4]李凯军. 计算机数据库的备份与恢复技术研究[J]. 数码设计(下),2020,9(1):13-14.

[5]金卫红. 计算机网络安全技术在网络安全维护中的应用研究[J]. 数码设计(下),2020,9(1):9-10.

[6]张丽,张江波. 基于云计算的计算机网络安全存储技术[J]. 计算机产品与流通,2020(12):16-17.

[7]黄连强. 试谈数据库的备份与修复[J]. 电脑编程技巧与维护,2019(7):88-90.

[8]韩勇鹏. 基于RMAN的oracle数据库备份与还原的设计与实现[J]. 计算机时代,2019(4):56-59.

[9]刘文韬,张振松,杜旖旎,等. 计算机网络安全中的数据备份[J]. 科学与财富,2021,13(2):106-106.

[10]沙波,李志浩,叶志远. "互联网+"时代信息系统备份技术[J]. 电子技术与软件工程,2019(1):140-140.