张献伟

副教授

联系邮箱: zhangxw79@mail.sysu.edu.cn

联系地址: 超算中心 - 422

个人主页: https://xianweiz.github.io/

教师简介: 

张献伟,“百人计划”副教授(2020-),博/硕士导师。于美国匹兹堡大学(University of Pittsburgh)获得计算机科学博士学位(Ph.D.,2017),曾任职于美国AMD/NVIDIA公司(2017-2020,2016)。

在学术界和工业界长期从事计算机系统、高性能计算及智能计算领域研究,包括GPU、编程编译、软硬件协同设计、应用支撑平台等。作为项目负责人主持国家重点研发课题、国家自然科学基金、CCF产研基金等项目10余项。研究成果论文发表在HPCA、DAC、LCTES等会议,完成多个成果转化、论文专利和开源工具等,获得广东省“科学技术进步特等奖”(参与)、中国科协“科技智库青年人才计划”、AMD Spotlight Award、ISLPED最佳论文奖等奖项荣誉。荣获中国计算机教育大会优秀教学案例一等奖、优秀论文一等奖、全国大学生系统能力大赛一等奖优秀指导教师等。

【Recruiting】招收硕博研究生,也欢迎有兴趣的本科生/Intern加入,详见 <招生Q&As>。

ARChitecture and SYStem Upscaling @ SYSU

研究领域: 

计算机系统结构(GPU,Memory)

编程及编译优化(Compilation)

高性能及智能计算(HPC,Intelligent Computing)

软硬件协同设计(SW/HW Co-design)

教育背景: 

2011.08 - 2017.08,美国匹兹堡大学(University of Pittsburgh),计算机科学,博士

2007.09 - 2011.07,西北工业大学,软件工程,学士

工作经历: 

2020.10 - 今,jbo竞博电竞官方网站 · jbo竞博电竞官方网站,副教授

2017.08 - 2020.09,AMD公司 · Research/RTG,研究员/工程师

2016.05 - 2016.08,NVIDIA公司 · Research,实习研究员

海外经历: 

2011.8 - 2020.9: Pittsburgh, PA (@UPitt) --> Seattle, WA (@AMD) --> Austin, TX (@AMD/Nvidia)

获奖及荣誉: 

科技智库青年人才计划,中国科协,2022

技术杰出贡献奖(Spotlight Award),AMD Inc.,2019

优秀博士全额奖学金(Andrew Mellon Fellowship), UPitt, 2016

最佳论文奖(Best Paper Award), ISLPED Conference, 2013

科研项目: 

超算互联网全局存储架构与数据资源管理,国家重点研发计划课题,2023 - 2026,主持

GPU软件层资源管理,国家自然科学基金面上项目,2025 - 2028,主持

GPU软硬件协同优化,国家自然科学基金青年项目,2022 - 2024,主持

大模型GPU推理加速,CCF-腾讯犀牛鸟基金,2024 - 2025,主持

面向高性能计算的容器镜像编译,CCF-华为胡杨林基金,2024 - 2025,主持

基于机器学习的编译优化,CCF-飞腾基金,2022 - 2024,主持

中日韩超算中心数据共享平台,NSFC国际合作A3前瞻计划项目,2024 - 2029,核心成员

主要学术兼职: 

ERC - MICRO (IEEE/ACM Int'l Sym. on Microarchitecture), 2020

TPC - ICCD (IEEE Int'l Conf. on Computer Design), 2020, 2019, 2018

TPC - ICPADS (IEEE Int’l Conf. on Parallel and Distributed Systems), 2022

TPC - HiPC (IEEE Int’l Conf. on High Performance Computing, Data, Analytics, and Data Science), 2022

TPC - NAS (IEEE Int’l Conf. on Networking, Architecture, and Storage), 2024

教授课程: 

Yat Compilation Course (YatCC), see yatcc-ai.com

课程:

编译原理/编译器构造实验(UG,25s/24s/23s/22s/21s)

计算机体系结构(UG,22f)、高级计算机体系结构(Grad,24f/23f/22f/21f)

奖项:

2024 · 教育部编译课程虚拟教研室最佳组织奖(“华为毕昇杯”全国大学生编译系统设计赛技术委员会委员)
2024 · 中国计算机教育大会优秀教学案例一等奖(“SYsU-lang:基于友好开发体验的LLVM编译实践教学”)
2023 · 计算机系统能力大赛“华为毕昇杯”编译系统设计赛全国一等奖(优秀指导教师)
2022 · 中国计算机教育大会优秀论文一等奖(“SYsU-lang:基于Clang/LLVM构建编译实践全局观”)

代表性论著: 

[DAC'2024] T. Guo, X. Huang, K. Wu, X. Zhang and N. Xiao.  SMILE: LLC-based Shared Memory Expansion to Improve GPU Thread Level Parallelism

[ICCD'2023] Z. Lin, Z. Mo, X. Huang, X. Zhang and Y. Lu. KeSCo: Compiler-based Kernel Scheduling for Multi-task GPU Applications

[LCTES'2022] T. Ge, Z. Mo, K. Wu, X. Zhang and Y. Lu. RollBin: Reducing Code-size via Loop Rerolling at Binary Level

[MEMSYS'2020] X. Zhang and E. Shcherbakov, DELTA: Validate GPU Memory Profiling with Microbenchmarks

[HPCA'2018] A. Gutierrez, B. Beckmann, et al, Lost in Abstraction: Pitfalls of Analyzing GPUs at the Intermediate Language Level

[HPCA'2016] X. Zhang, Y. Zhang, B. Childers and J. Yang, Restore Truncation for Performance Improvement in Future DRAM Systems