姓名:翟季冬

职称:助理研究员

电子邮件:zhaijidong@tsinghua.edu.cn

主页:http://pacman.cs.tsinghua.edu.cn/~zjd/

 

教育背景

工学学士(计算机科学与技术),电子科技大学,中国,2003

工学博士(计算机系统结构),清华大学,中国,2010

 

研究领域

高性能计算、并行程序优化、性能测试、云计算

 

研究概况

主要研究大规模并行程序的性能分析和优化、高性能计算机性能评测、云计算等。近年来,高性能计算机的系统规模持续增大,随之带来很多新的问题和挑战。例如,现有很多应用程序很难扩展到成千上万个节点的大规模系统,系统的稳定性和可靠性也面临很大挑战。我带领的研究小组针对这些问题开展了相应的研究。

目前我们对基于GPU、MIC、APU等加速器件的异构平台上的并行程序的性能分析和优化开展研究,主要研究如何通过编译技术、运行时系统等手段来自动优化程序,提高程序的性能和可扩展性。 

相关研究成果发表在并行计算领域的重要期刊和学术会议上,如SC,PPoPP,HPDC,TPDS等,其中2014年的SC论文入选会议Best Paper Finalist,这是大陆学者首次入围该奖项。获中国电子学会电子信息科技一等奖,教育部科技进步一等奖,2009年西贝尔学者,2010年中国计算机学会优秀博士学位论文,2010届清华大学优秀博士毕业生,2012年清华大学优秀博士后,入选2013 年微软亚洲研究院“铸星计划”。

研究课题

863课题:云计算测试与评估系统研制(2013-2015)

863课题:面向多核/众核处理器的并行程序调试技术与工具(2012-2015)

国家自然基金:面向高性能云平台的并行程序优化关键技术研究(2015-2018)

国家自然基金:基于进程相似性的大规模并行程序在线可扩展分析方法研究(2012-2014)

 

奖励与荣誉

清华大学优秀博士后(2012)

中国计算机学会优秀博士学位论文(2010)

清华大学优秀博士毕业生(2010)

教育部科技进步一等奖(2009)

西贝尔学者(2009)

 

学术成果

[1] Jidong Zhai, Jianfei Hu, Xiongchao Tang, Xiaosong Ma, Wenguang Chen. CYPRESS: Combining static and dynamic analysis for top-down communication trace compression. SC 2014. (Best Paper Finalist).

[2] Mingliang Liu, Ye Jin, Jidong Zhai, Yan Zhai, Qianqian Shi, Xiaosong Ma, Wenguang Chen. ACIC: automatic cloud I/O configurator for HPC applications. SC 2013.

[3] Shuangcheng Niu, Jidong Zhai, Xiaosong Ma, Xiongchao Tang, Wenguang Chen. Cost-effective cloud HPC resource provisioning by building semi-elastic virtual clusters. SC 2013.

[4] Jidong Zhai, Tianwei Sheng, Jiangzhou He, Wenguang Chen, Weimin Zheng. Efficiently Acquiring Communication Traces for Large-Scale Parallel Applications. IEEE Transactions on Parallel and Distributed Systems, Volume:22, Issue:11, November 2011.

[5] Yan Zhai, Mingliang Liu, Jidong Zhai, Xiaosong Ma and Wenguang Chen. Cloud Versus In-house Cluster: Evaluating Amazon Cluster Compute Instances for Running MPI Applications. State of the Practice Reports. SC 2011.

[6] Jidong Zhai, Wenguang Chen, Weimin Zheng. PHANTOM: predicting performance of parallel applications on large-scale parallel machines using a single node. PPoPP 2010: 305-314.

[7] Jidong Zhai, Tianwei Sheng, Jiangzhou He, Wenguang Chen, Weimin Zheng. FACT: fast communication trace collection for parallel applications through program slicing. SC 2009.

[8] Jin Zhang, Jidong Zhai, Wenguang Chen, Weimin Zheng. Process Mapping for MPI Collective Communications. Euro-Par 2009: 81-92.