讨论高性能计算的应用于推广

(整期优先)网络出版时间:2019-10-27
/ 2

讨论高性能计算的应用于推广

王川

国家超级计算天津中心天津300000

摘要:高性能计算机主要是指具有高运算能力、大存储容量、强大计算和处理数据能力,可以处理一般计算机无法处理的大量数据资料,还包括功能丰富的软件系统、多样的外部设备的计算机。高性能计算机主要运用在科学研究及军工领域,其决定了一个国家的综合国力发展,为国家的信息化建设提供了根本性的保障,它对国家安全,经济和社会发展具有举足轻重的意义。因此高性能计算机研究发展,不仅推动科技的发展、改善人民生活水平、推进社会进步、加强信息化建设及国民经济建设,而且在加强国防建设与国家安全等方面催生大量相关产业的发展。

关键词:高性能计算;应用

引言

近20年来,高性能计算应用的广度前所未有地扩展,以数据驱动或数据密集型计算为主要特征的高性能计算应用不断涌现,人工智能技术在新型和传统高性能计算应用领域获得成功实践,应用领域遍及生物信息与生命科学领域、智慧城市与城市治理、网络信息安全等。这些应用又反过来对高性能计算技术,包括矩阵并行求解技术、高性能大数据处理技术、智能芯片技术等,产生巨大的影响,促进了高性能计算技术创新。

1高性能计算机的发展

高性能计算机从20世纪70年代开始发展,其中从向量机、大规模并行处理计算机(MPP)、集群等阶段逐步发展。1982年克雷公司生产世界上第一台并行向量机CrayX-MP/2,采用先行控制和重叠操作技术、运算流水线、交叉访问的并行存储器等并行处理结构。20世纪90年代起,基于微处理器的MPP逐渐成为高性能计算机主流。该系统的主要特点是具有较多松耦合处理单元,其中每个单元内都具有操作系统及管理数据库的实例复本,而单元内的CPU也具有私有的资源,但是其最大的缺点是资源不共享。20世纪90年代中期,随着电脑的成熟和局域网技术的快速发展,主流方式为计算机集群。集群就是将多个松散的计算机(节点)用软件或硬件连接起来,完成高度紧密的计算协调工作的计算机系统。其一般采用局域网连接,也包含其他连接方式。

2高性能计算应用

2.1高性能计算在智慧城市领域获得广泛应用

2008年,IBM提出智慧地球愿景,智慧城市的概念也随之出现。交通拥堵、环境污染、气候变化、犯罪率上升等一系列问题降低了城市的宜居、宜产程度。智慧城市利用各类传感器采集的数据,汇聚到高性能计算平台,在集成处理的基础上,服务城市决策、社会生产和居民生活。而遍布城市的各类传感器及物联网设备采集的数据,呈现爆炸式增长。2018年,中国的数据总量约为7.6ZB(1ZB=1021字节),占全球总量的23.4%。预计到2025年,中国的数据总量将增长至48.6ZB,占全球数据总量的27.8%,中国将成为全球最大的数据圈。大规模数据的产生,对数据管理和处理技术提出了严峻的挑战。如何从各种各样类型的大量非结构化视频数据中精准提取目标信息,包括人、车、物以及各种行为信息,仍是视频信息处理的难点。未来的5G通信技术能够提供极快的传输速度,支持更多的终端接入,缩短延时时间。通信时间大幅缩短之后,“请求-响应”时间的长短对实时计算的要求更高,作为支撑智慧城市深入发展和广泛应用的核心技术,高性能计算也面临着机遇和挑战。当前主流型号服务器,支持10—100通道视频实时处理,大城市监控视频达到10—100万个摄像头,后台处理就可能需要1万节点规模。

2.2促进机器人产业升级和工业转型发展

2013年起,我国已成为全球最大的机器人市场,预计2022年将占全球总量的38%以上,因此机器人的普遍应用是必然趋势。目前其开始渗入生活的方方面面,像医疗服务、家庭娱乐、食品饮料等行业。目前已有上海、广州、重庆等39个城市相继提出了打造机器人产业基地的构想,网络化、数字化、智能化、无人化已成为机器人技术发展的重要趋势。机器人需要中央处理器,才能跟操作它的人有直接的联系,才可以进行设定好的动作。因此,加大与机器人行业及相关公司的联系,出租相应的计算机,利用其高性能、高运算的特性,对机器人进行模拟仿真升级改造,促进机器人产业及工业的发展。

2.3进行大数据分析

目前社会的发展,每天都产生大量的数据,而且呈爆炸式增长,在大容量、高增速和多样性等方面,对现代企业的数据处理和分析能力提出了更高的挑战,同时也使得企业可以更丰富、更深入和更准确地洞察市场行为。但是,现在面临最大的挑战是如何从大数据中发掘出真正有价值的信息。大数据分析是从数据的采集开始,收集来自各个客户端的海量数据,然后再进行数据的导入与预处理,这一步骤导入的数据量达到千百兆,接下来利用分布式数据库进行统计和分析,涉及的分析数据量非常大,对系统资源的要求高,最后再运用各种算法进行预测分析。

2.4在蛋白质结构预测应用方面

蛋白质结构预测与设计对深入理解蛋白质结构和功能具有重要意义。蛋白质是一切生命系统的物质基础,但其生物功能的发挥,需要蛋白质正确折叠为特定的3D结构,蛋白质折叠研究也是药物设计的基础。实验学的方法如X射线(X-ray)、核磁共振(NMR)和冷冻电镜解析蛋白质3D结构普遍存在设备昂贵、时间和人力成本过高等问题。开发能够自动、快速、准确地将未知蛋白序列分类为特定折叠类别的计算预测方法成为计算生物学家长期努力的方向。使用深度卷积神经网络和残存网络高精度的预测蛋白中的氨基酸-氨基酸接触作用,并将预测结果直接用于蛋白质3D结构重建是近期的一个热点。谷歌DeepMind将AlphaGo转型,开发了可预测蛋白质折叠的程序AlphaFold,并以该项目参加了全球蛋白质结构预测竞赛CASP13,取得了优异的成绩。麻省理工学院(MIT)的Belpler和Berger利用人工智能(AI)技术,直接通过氨基酸序列预测蛋白质分子的生物学功能。

2.5隐私保护

隐私保护是大数据时代面临的重大挑战。大数据技术往往具有两面性。一方面,研究人员可以通过大数据发现数据之间的内在关联,提供对事物的多视角洞察,给数据持有者更多的决策信息;另一方面,攻击者对大数据的内在联系的分析,往往使得数据的隐私难以得到有效的保障。在除去患者标记的某种疾病病例中,攻击者可以通过社保、出行记录、消费记录等数据来综合推断出患者的信息。因此,大数据中的数据隐私保护是至关重要的。

2.6在新药创制应用方面

高性能计算可在加速药物研发,降低药物开发风险的多个方面发挥重要作用,如超大规模筛选药物先导化合物、大规模搜寻药物潜在靶点、精确计算蛋白配体自由结合能、精确计算电子级别靶点药物共价和非共价作用、复杂生物体系模拟、药物网络化相互作用等。国内,北京大学、中国科学院上海药物研究所、上海交通大学在相关领域做出了可喜成果。

结束语

我国的超级计算机研究虽然起步较晚,与发达国家的差距较大,但是这些年来奋起直追,已经站在了世界超算研究的第一梯度,取得了不少瞩目的成果。在当今信息科技迅速发展的时代以及我国产业转型的重要节点,我国的城镇发展、智能制造、国防安全、智慧校园、数字化生活等都将更加依赖高性能计算机。我国未来高性能计算机的发展,需要一个科学合理的环境,既需要国家的政策支持,也需要企业、高校、研究所的自主创新、产学研用结合。只有多方面共同努力,才能发展和发挥高性能计算机的作用。

参考文献

[1]刘金霞,李晶,栾永明,王慧瑜,赵威,赵苗.高性能计算机系统管理技术的研究[J].电脑知识与技术,2015,11(30):186-187.

[2]张云泉.2015年中国高性能计算机发展现状分析与展望[J].科研信息化技术与应用,2015,6(06):83-92.

[3]司维,程李,李文娟.高性能计算技术在气象领域中的应用探讨[J].科技传播,2014,6(16):231+192.