大数据背景下云存储数据安全研究

(整期优先)网络出版时间:2023-03-13
/ 2

大数据背景下云存储数据安全研究

孙涛,高利娟,范威,周浩

中国电子科技集团公司第五十二研究所 311100

摘要:伴随大数据时代的到来,云计算、云数据等技术飞速发展,区块链技术的出现更是彻底改变了人们的工作生活,大数据技术应用发展的不断深入,对数据中心有了更高的要求,不仅需要数据中心具备足够规模的数据吞吐能力,也有要求数据中心的存储基础架构安全型符合使用需求。大数据时代下,数据规模逐步庞大,人们使用各类基于大数据技术的各项应用,对自身在生活工作中产生的诸多信息进行实时的存储,如文字信息、语音信息、照片、视频、消费记录、搜索记录等等,传统硬盘等数据存储手段已经不断满足现代人的需求,云数据技术的出现彻底打破了数据存储的时间、空间、地域、规模限制。让人们可以随时随地进行数据的交互,但数据安全威胁也逐步加大,如何加强云数据技术的安全性能以及成为云数据技术发展必须面对的问题。

关键词:大数据;云存储;数据安全

引言

在云存储环境下,通过删除客户端数据,可以在本地检索到大量重复文件,有效节省存储空间和网络带宽。但是,客户端重复数据消除仍然面临许多安全挑战。首先,由于文件散列可以用作重复性测试的基础,攻击者很可能使用文件散列来获取整个文档。其次,为了维护企业数据信息的安全性,虽然收敛密码可以应用于企业数据的反拷贝方法,但由于企业数据本身是可预测的,收敛密码不可避免地会遇到字典的威胁。因此,文章利用盲签名技术建立了一个安全的密码生成协议。由于块密钥服务器的引入,实现了聚合密钥的再安全加密,有效防止了暴力字典入侵,并给出了基于块密钥签名的所有权认证方法,可以防止攻击者通过单个散列值获取文件,同时,它减少了加密文档中文件级和块级的重新加权。

1云存储数据安全

大量的数据给企业和个人都带来巨大的存储压力和存储需求,同时也推动了存储市场的急速发展,涌现出了大量的提供数据存储和管理的企业公司,譬如国际上比较出名的亚马逊、谷歌和微软等,国内比较知名的百度、华为、腾讯和阿里等,这些知名公司依托自己在全球的大型数据中心,通过快速的互联网络为客户提供云存储服务。云存储实际上就是一个中心计算系统,允许使用者通过互联网把数据存储在数据中心的系统中并且可以方便的分享给其他人。云存储的优点有很多,理论上用户可以获得无限的存储空间,而且可以随时随地通过网络方便,安全,高效的访问数据,实现数据的异地备份和下载,大大降低了数据存储和使用的成本。云存储从提出至今,已经经过了一轮爆炸式的发展,几大云存储服务提供商经过几轮竞争淘汰,国际上和国内云存储的市场基本趋于稳定,逐渐向着高质量发展,随着质量的提升,快速吸引了政府、企业和个人用户都在积极将数据迁移到云端,云存储逐渐成为当今新时代环境下不可替代的重要一部分,这么多关系到整个国家社会政治经济的数据是一笔可以进行再创造的巨大财富。但是,将所有数据放在云存储系统中的同时也增加了潜在的存储的风险,例如,未经授权的访问,数据泄漏,敏感信息泄漏和隐私披露等。

2大数据背景下云存储数据安全研究

2.1隐私保护的数据分割技术

采用数据分割技术对大数据进行保护。为了保护敏感数据,将整体的数据分割成若干可以独立管理并以清晰的形式存储,而不需要引用存储在不同位置的其他数据。在这种方法中,入侵者无法通过使用一个单一的片段识别相应的主体,也就无法窃取隐私和重要数据。例如,如果入侵者窃取的片段包含一个用户名称的数据列表,但是他们不能通过这个列表了解任何关于用户名称的其他信息。在保留隐私的数据分割方法中,敏感数据文件被转换为字节,这些字节被组合为一系列的部分内容。根据数据隐私的优先级,使用不同的云来存储部分数据。

2.2云存储数据安全状况分析

伴随云存储技术的不断流行,云存储产品数量不断增多,市场竞争力不断增加,许多云存储的服务商为了提高产品的市场占有能力,纷纷不断降低价格,提高服务宽度、服务容量,占用了大量的经营和研发成本,导致数据安全方面的投入较少,系统安全性普遍不足。对于多数用户而言,数据安全性需求要大于其他服务需求。目前我国多数云存储平台,加强了安全系统的构建,并取得了一定的成果,云数据系统的整体安全性得到了有效的提高,但在数据保密方面,仍存在许多弊端。如亚马逊公司的云服务平台,存储服务和数据库服务没有提供分级的数据加密技术导致数据存在泄漏的风险。华为网盘提供了面向文件的数据存储服务,并有着强大的数据同步和数据共享功能,但是不支持数据的加密。

2.3网络程序接口及软件开发环境安全措施

云应用和操作严重依赖于web服务作为核心启用技术,除web服务外,用户通过web服务访问云服务和操作的前端环境(主要是web浏览器)也需要应对措施来解决web浏览器的漏洞。web浏览器的漏洞在很大程度上归因于对插件赋予的权限级别。使用可信任的插件,同时使用配置文件更新的反病毒和反间谍软件来提高安全性。为了开发一致且高质量的软件系统,从概念形成到软件交付,需要考虑很多特性。可以通过定义可靠的软件质量标准和软件开发生命周期来度量它们,以确保控制与质量一起有效和正确地实施。譬如微软定义了安全开发生命周期,这是一个软件开发过程,帮助开发人员构建更安全的软件,并以较低的成本满足安全合规要求,以识别软件应用程序特定的威胁和相关的风险。在更广泛的层面上,软件系统的用户体验优先于软件的质量和可用性,确保用户数据的安全性和私密性可以增强用户体验。

2.4数据去重技术

重复数据消除技术可以使CSP只保存一个文档,可实现空间的节省。结合数据粒度,重复数据消除包含文件级重复数据、块级重复数据两类。与文本级重复数据分析和删除类似,块级重复数据分析和删除也可以大大提高重复数据分析的删除率,节省空间。但是,根据删除重复数据分析的位置,有两种类型的删除重复数据分析:①删除服务器端的重复数据,用户将数据分析结果传输到云服务器内,分析并将重复数据删除,这一操作能够节省内部空间,但会加剧带宽资源的消耗。②服务器端重复数据消除:CSP在接受单个用户的上传请求时保存原始数据文档。对于后续的文档上传请求,只需与需要上传的用户共享原始数据文档的权限,用户无需将文档上传到云服务器。对这些新的教学方法的研究不仅节省了空间,而且节省了时间,降低了传输带宽。

结语

在当前这个数据互相连通的时代,用户选用云存储服务的目的是借助云存储的诸多优势最终能够将自己的数据安全共享给数据使用者,然后通过数据的融合与挖掘使数据产生价值,从而推动新兴数字产业的发展。数据共享可以使处于不同物理位置、持有不同终端设备、使用不同软件的用户以授权的方式获取他人数据,并将其用以进行各类操作、运算及分析,这使得数据不再是一座孤岛,数据价值得以提升。然而云作为一个不可信的环境,使运行其中的数据共享活动面临诸多问题,包括数据和用户身份的安全性与隐私性问题等,这已然成为人们犹豫是否使用云存储服务时不可回避的症结所在。

参考文献

[1]鲁金钿,肖睿智,金舒原.云数据安全研究进展[J].电子与信息学报,2021,43(4):881-891.

[2]胡贞华,陈雪花.数据治理中安全保障措施的探究[J].网络安全技术与应用,2022(06):2-2.