要怎么理解有人认为“然并卵”的天河二号“六

站长资源 2021-07-09 13:20www.dzhlxh.cnseo优化

据说,超算的运营费用非常高,电费一年就1000w;据说,超算短时间内还无法“连接”实际应用······然并卵的事情这么多,那么,国家花费大量人力物力投入到超算的建设和发展中到底是为了什么?超长分析文给你答案!

据新华社电,新一期全球超级计算机500强榜单16日在美国公布,中国“天河二号”超级计算机连续第六度称雄。

据国际TOP500组织发布的榜单,第一名“天河二号”的浮点运算速度为每秒33.86千万亿次,第二名美国“泰坦”的浮点运算速度为每秒17.59千万亿次。第三名至第五名依次为美国“红杉”、日本“京”和美国“米拉”超级计算机。实际上,这5台超级计算机的排名自2013年6月以来就没有变化。

对此,有人媒体评论:一次两次叫幸运,连着6次就只能说是实力了。但也有人指出,中国的超级计算机在500强的榜单中获得了斐然的成绩,然而这份成绩还是过于表面化了。

据悉,国外建设超级计算机的目的是为应用,而中国的超级计算机一般都是租给第三方。从建设超级计算机的角度来讲,中国和日本、美国以及欧洲的水平其实不相上下,但在建设思路上,中国却与其他国家截然不同。其他国家一般是先统计超级计算机在各领域所需的数量,而中国的思路是先做大再说。撇开其他原因不谈,中国能够在这一领域迅速发展的原因与注重数量不无关系。这多少有些“冒进”的意思,如果照这个思路下去,那么将来如果有“天河三号”,估计还会是世界第一。

到底,我们该如何理解天河二号的“六连冠”以及中国超级计算机的发展,知乎网友曾针对天河二号的几次夺冠以及相关信息进行讨论,让我们来看看他们的回答(以下内容精选自知乎)。

问题一:“天河二号”获全球超算“五连冠”意味着什么?

@冯东

关于天河二号本身,知乎上已经有过讨论。所以我想题主是想针对「五连冠」这点。

其他答案提到,前五名最近几年都没变。相反,在 Top 500 上,美国占 233 台机器,中国占 37 台(去年的数字是 61 台)。

你觉得是去到处招客户,让一个大机器高效运行容易还是让每个科研机构有一台够用的机器运行容易?所以问题就是没有那么大需求去烧钱造个大新闻赶超天河二号。

说句后话,Top 500 开始的时候是计算能力短缺的年代。而现在是计算能力过剩的年代(至少对于数据存储的地理分布来说是局部过剩的)。你可以说我们怎么都能黑中国,问题是中国在这些指标上发力的时候往往是指标本身的意义已经发生变化的时候。

@匿名用户

反对 @冯东的最高票答案。

你觉得是去到处招客户,让一个大机器高效运行容易还是让每个科研机构有一台够用的机器运行容易?所以问题就是没有那么大需求去烧钱造个大新闻赶超天河二号。

事实上,让每个科研机构都有一个集群才是莫大的浪费。 国内现在很多中小实验室热衷于自己购买机器,其实并没有那么大的必要性。分散的大量集群,闲置率远远高于集中式的(比如拿来挖比特币的事情已经爆料过好几次了),维护代价还高,过几年因为落后而淘汰了。

超算系统并不简简单单的一台机器, 可以实现云计算一样的弹性分配。一个用户要用多少节点,系统可以直接配置分配多少节点给你。在这个意义上,这样的共享式的大机器更加有效率。中国科研管理机构应该学习美国对超算的使用方式,鼓励科研机构使用超算中心的机器,减少服务器购买的重复投资。美国的许多超算都是由能源部下属的国家实验室建造管理,以计算资源的形式分配给各种科研项目。

说句后话,Top 500 开始的时候是计算能力短缺的年代。而现在是计算能力过剩的年代(至少对于数据存储的地理分布来说是局部过剩的)。

计算能力真的过剩吗? 我想无论是以互联网公司大数据的视角还是从科学计算的角度都谈不上过剩。 现在的问题并不是计算能力太多,而是缺乏算法设计和应用开发的技术来充分利用这些计算能力。简单的说,就是现实需要这样甚至更高的计算能力,但问题是现在瓶颈就在于利用这样高的计算能力还有很多现实局限,需要继续去探索。

你可以说我们怎么都能黑中国,问题是中国在这些指标上发力的时候往往是指标本身的意义已经发生变化的时候。

在别人已经到达终点的时候,你还剩下几圈,并不是什么丢脸的事。因为不坚持,就永远没有追上别人的时候。中国现在在做的很多事情,都还是在前200~300年落下的课。超算代表的不仅仅是堆一堆机器,还有看不到从芯片、架构、网络互联、存储、操作系统、编译、算法、应用开发一系列的生态技术链,无法跨越。天河仅仅是一个承载体和一个里程碑。 未来能不能够超越别人,没人敢肯定。但是今天不走这样的路,就永远没有机会。

ps: “天河一号闲置一年” 需要补充说明一些。 首先澄清一点,闲置的“天河一号”并不是天津超算的前世界第一的超级计算机,天津的是“天河1A”。媒体报道的天河一号是“天河1A”的试验机。天津的天河1A现在已经是饱和运行,用户需要排队使用了。

问题二:全球最快计算机天河二号的研发意义是什么?

@luke

作为曾经的业内人士,也就是之前卖超算的,随便说点吧,有些算是科普,有些算是自己的想法。另外作为国家级别的大项目,细节也不是我能知道的,所以很多数据可能不是非常有说服力,请读者不要太较真了。这将是一个长答案,我慢慢写。

首先,扔出一个公认的、公正的超算排行网站:Home | TOP500 Supercomputer Sites,这上面的数据可以被认为是权威和可信的。

然后,给出天河二号在其上的数据,然后再分别解释一下几个名词

前三个就不说了,从第三个开始:

Cores: 很简单,就是整个系统总共的处理器核心数量。这里不是处理器的数量,是核心数量。比如该系统使用的intel xeon E5-2692 处理器和intel xeon phi 3100系列协处理器搭建的。而一颗E5-2692有12个核心,一片phi 3100系列协处理器有57个核心。拿着两种处理器一样不一样呢?这个我们稍后再讲。当然这里面还有我们国产的处理器,这个也稍后再讲。

Rmax(TFlop/s): 这一项是整个系统的实际最大计算能力,也就是这个榜排名的依据。这个数越大,排名越考前。天河二号排名第一,也就是说这个数在2013年6月分榜单里面最大。

Rpeak(TFlop/s):这一项是整个系统的的理论上的计算能力。这个数排名的时候没有意义,但是在说明技术实力的时候,那是真真的重要。这个也稍后再说。

Power(kw):这个就很简单了,整套系统的功耗。这里面不包含机房里面UPS、精密空调、照明、新风等等等等的耗电量。

更新分割线----------------------------------------

以上就是简单的名词解释,从最基本的参数来看,天河二号是这样一套系统:

Rmax,即实际的最大计算能力,是33862.7万亿次每秒。这个数据在2013年6月份的榜单里排名第一。

(注:TFlop/s是超算计算性能的单位,即每秒钟进行一万亿次双精度浮点运算)

Copyright © 2016-2025 www.dzhlxh.cn 金源码 版权所有 Power by

网站模板下载|网络推广|微博营销|seo优化|视频营销|网络营销|微信营销|网站建设|织梦模板|小程序模板