新闻 图说CPC赛事通知新网直通车 新网会客厅

第二届国产CPU并行应用挑战赛颁奖晚宴在青岛隆重举行

浏览次数:1822 发布时间:2018-10-26-06:10:00

2018年10月18日晚,第二届国产CPU并行应用挑战赛颁奖晚宴在青岛国际会展中心隆重举行。

2000余位高性能计算行业嘉宾齐聚一堂共同见证CPC201815支参赛队旗开得胜、问鼎巅峰。

大赛指导委员会主席 漆锋滨研究员

颁奖环节开始前,大赛指导委员会主席国家并行计算机工程技术研究中心的漆锋滨研究员首先致颁奖开幕词。他提到"国产CPU并行应用挑战赛今年举办第二届,共收到168支队伍报名参赛,相较去年146支,数量提升了15%,这是一个可喜的趋势。大赛不仅在参赛队数量上得到快速提升,而且参赛水平也得到极大提升。今年决赛题目加大难度,但依然有不少优秀队伍克服重重困难取得了优异成绩。大赛连续两年不断有参加国际超算比赛的强队加入我们高水平的技术角逐,通过两届比赛,我们培养和发掘了一批可塑造可培养的优秀人才,也让全国范围内更多单位更多师生了解、学习国产芯片的环境和使用方法,相信经过我们不懈的努力,我们国家缺芯少魂的局面一定能得到极大改善,国产生态的完善指日可待!

大赛评审委员会主席 张云泉研究员

颁奖环节开始前,大赛评审委员会主席中国科学院计算技术研究所张云泉研究员致辞道“首先恭喜获得各类奖项的参赛队,也很欣慰看到这么多队伍经过重重考验取得了如此优秀的成绩。CPC国产CPU并行应用挑战赛今年是第二届,参赛队伍数量相较去年又有了很大的提升,这说明大赛的知名度越来越大影响力越来越深远,同时,我们很欣喜的看到,参赛队的技术水平不断在提高,尽管本届决赛题目难度较大,但是还是有不少黑马队伍突出重围创造佳绩。相信经过我们在座各位专家、教师和同学的共同努力,国产”芯“生态会越来越完善!”。

大赛组织委员会主席 陈健博士

大赛组织委员会主席北京并行科技股份有限公司CEO陈健博士致辞道“CPC大赛已举办两届,第一届的时候参赛队就快速突破了100支,这说明国产芯生态的完善是大势所趋。那么经过两年的积累,组委会通过各类线上线下活动、搭建各类沟通平台等等方式方法,将国产芯的基础知识、编译环境、应用概况等进行了大面积的普及并且如大赛初衷,我们发现了一批优秀可进一步培养的国产芯片领域优秀人才。祝贺各单位各参赛队,希望在座各单位有更多的参赛队伍加入比赛,为完善国产“芯”生态继续加油!”

获奖队伍名单

金奖

山东大学 多喝热水多看文档队

陈国良院士、吴立新院士、王英龙研究员为金奖获奖队颁奖

银奖

中国科学技术大学 鲲鹏队

中国科学院计算机网络信息中心 Hello World

袁国兴研究员、孙凝晖研究员为银奖获奖队颁奖

铜奖

中山大学 SYSU_ASC

清华大学 四个程序员队

西北工业大学 西北工业大学高性能计算中心队

华东师范大学 ECNUCC

成都信息工程大学 Quantum

漆锋滨研究员、张云泉研究员、胡庆丰教授、莫则尧研究员、魏志强研究员为铜奖获奖队颁奖

赛区一等奖

成都信息工程大学 耦合队

中国地质大学(武汉)地大之光超算1

中国地质大学(武汉)地大之光超算2

清华大学 cjoier

清华大学 Victorization

山东科技大学 First_Blood

北京理工大学 BIT Faster

潘景山副主任、刘鑫研究员、肖侬教授为赛区一等奖获奖队颁奖

初赛英雄榜前三甲

中国地质大学(武汉) 地大之光超算1

中国地质大学(武汉) 地大之光超算2

山东科技大学 First Blood

张玉教授、陈健博士为初赛英雄榜获奖队颁奖

专家点评

Gromacs最初是一个为了模拟复杂生物分子设计的分子动力学软件, 具有性能优异, 功能多样, 配套生态齐全等优势, 经历了长期的发展, Gromacs渐渐发展成为现代化的拥有数十万行代码大型应用, 也成为了目前最受欢迎的分子动力学软件之一。

CPC2018选择分子动力学软件Gromacs作为决赛题目, 具有如下的难点:

1) 比赛时间短, 代码量大: Gromacs有数十万行代码, 而比赛的时间只有20几天, 参赛队需要快速在Gromacs中找到运行时的热点并进行深入的优化。

2) 算法优化难度大: 分子动力学存在访存随机, 通信压力大的特点, 而且在神威-太湖之光上的可以借鉴的前期实践较少, 参赛队需要进行足够的创新才能在国产CPU上获得好的优化效果。

3) 基于真实应用进行优化: Gromacs具有复杂的工程结构, 参赛队需要良好的软件工程能力才能将自己优化与Gromacs结合起来, 在不失去Gromacs真实应用意义的前提下展现自己的优化能力。

4) 测试用例各有侧重: 决赛提供的三个测试用例中, 离子通道算例会遇到负载均衡问题, 木质纤维在64进程下是计算和访存密集问题, 而在512进程下又会变成通信和IO密集问题, 这要求参赛队对应用进行足够细致的优化才能在比赛中脱颖而出。

这些都对参赛队造成了极大的困难, 经过20几天的激烈角逐, 参赛队们展现出了顽强的意志和丰富的智慧, 从开始无法完成源代码的编译, 到分析, 到尝试, 到看到优化的效果, 展现出了许多亮点:

1) 优化思路丰富: 参赛队对于解决赛题中存在的难点各显神通, 同样是对于Gromacs中访存随机的问题, 有的参赛对原子团的随机读写采用软件Cache的方法解决, 有的参赛队通过对原子团数据的打包整合, 将小块随机访存变成了更适合国产CPU的访存形式。

2) 优化程度深: 参赛队对于赛题中的热点进行了细致入微的优化, 例如非键力中计算代码虽然非常复杂, 但是很多参赛队实现了向量化, 甚至基于嵌入汇编的流水重排等技术, 获得了极好的计算性能。

3) 优化范围广: 参赛队不仅对于计算, 访存的部分进行了优化, 同时有的参赛队对于文件系统和网络负载较重的部分实现了绕过stdio单独实现缓冲, RDMA等技巧实现了有效的优化。

4) 动手能力强: 除了对于应用本身的优化之外, 有些参赛队为了更好地实现对于应用的分析与优化DIY了多种多样的工具, 极大地提升了应用分析与优化的效率。

最终, 决赛队伍实现了对完整算例至多26倍的有效加速, 一方面展现出了自身的优化水平和竞技精神, 另一方面为类似算法在神威-太湖之光上的优化积累了宝贵经验。

CPC2018决赛获奖队部分师生与神威·太湖之光合影留念


版权所有 国产CPU并行应用挑战赛