
教师简介:
张献伟,“百人计划”副教授(2020-),博/硕士导师。于美国匹兹堡大学(University of Pittsburgh)获得计算机科学博士学位(Ph.D.,2017),曾任职于美国AMD/NVIDIA公司(2017-2020,2016)。
在学术界和工业界长期从事计算机系统、高性能计算及智能计算领域研究,包括GPU、编程编译、软硬件协同设计、应用支撑平台等。作为项目负责人主持国家重点研发课题、国家自然科学基金、CCF产研基金等项目10余项。研究成果论文发表在HPCA、DAC、LCTES等会议,完成多个成果转化、论文专利和开源工具等,获得广东省“科学技术进步特等奖”(参与)、中国科协“科技智库青年人才计划”、AMD Spotlight Award、ISLPED最佳论文奖等奖项荣誉。荣获中国计算机教育大会优秀教学案例一等奖、优秀论文一等奖、全国大学生系统能力大赛一等奖优秀指导教师等。
【Recruiting】招收硕博研究生,也欢迎有兴趣的本科生/Intern加入,详见 <招生Q&As>。
ARChitecture and SYStem Upscaling @ SYSU
研究领域:
计算机系统结构(GPU,Memory)
编程及编译优化(Compilation)
高性能及智能计算(HPC,Intelligent Computing)
软硬件协同设计(SW/HW Co-design)
教育背景:
2011.08 - 2017.08,美国匹兹堡大学(University of Pittsburgh),计算机科学,博士
2007.09 - 2011.07,西北工业大学,软件工程,学士
工作经历:
2020.10 - 今,jbo竞博电竞官方网站 · jbo竞博电竞官方网站,副教授
2017.08 - 2020.09,AMD公司 · Research/RTG,研究员/工程师
2016.05 - 2016.08,NVIDIA公司 · Research,实习研究员
海外经历:
2011.8 - 2020.9: Pittsburgh, PA (@UPitt) --> Seattle, WA (@AMD) --> Austin, TX (@AMD/Nvidia)
获奖及荣誉:
科技智库青年人才计划,中国科协,2022
技术杰出贡献奖(Spotlight Award),AMD Inc.,2019
优秀博士全额奖学金(Andrew Mellon Fellowship), UPitt, 2016
最佳论文奖(Best Paper Award), ISLPED Conference, 2013
科研项目:
超算互联网全局存储架构与数据资源管理,国家重点研发计划课题,2023 - 2026,主持
GPU软件层资源管理,国家自然科学基金面上项目,2025 - 2028,主持
GPU软硬件协同优化,国家自然科学基金青年项目,2022 - 2024,主持
大模型GPU推理加速,CCF-腾讯犀牛鸟基金,2024 - 2025,主持
面向高性能计算的容器镜像编译,CCF-华为胡杨林基金,2024 - 2025,主持
基于机器学习的编译优化,CCF-飞腾基金,2022 - 2024,主持
中日韩超算中心数据共享平台,NSFC国际合作A3前瞻计划项目,2024 - 2029,核心成员
主要学术兼职:
ERC - MICRO (IEEE/ACM Int'l Sym. on Microarchitecture), 2020
TPC - ICCD (IEEE Int'l Conf. on Computer Design), 2020, 2019, 2018
TPC - ICPADS (IEEE Int’l Conf. on Parallel and Distributed Systems), 2022
TPC - HiPC (IEEE Int’l Conf. on High Performance Computing, Data, Analytics, and Data Science), 2022
TPC - NAS (IEEE Int’l Conf. on Networking, Architecture, and Storage), 2024
教授课程:
Yat Compilation Course (YatCC), see yatcc-ai.com
课程:
编译原理/编译器构造实验(UG,25s/24s/23s/22s/21s)
计算机体系结构(UG,22f)、高级计算机体系结构(Grad,24f/23f/22f/21f)
奖项:
2024 · 教育部编译课程虚拟教研室最佳组织奖(“华为毕昇杯”全国大学生编译系统设计赛技术委员会委员)
2024 · 中国计算机教育大会优秀教学案例一等奖(“SYsU-lang:基于友好开发体验的LLVM编译实践教学”)
2023 · 计算机系统能力大赛“华为毕昇杯”编译系统设计赛全国一等奖(优秀指导教师)
2022 · 中国计算机教育大会优秀论文一等奖(“SYsU-lang:基于Clang/LLVM构建编译实践全局观”)
代表性论著:
[DAC'2024] T. Guo, X. Huang, K. Wu, X. Zhang and N. Xiao. SMILE: LLC-based Shared Memory Expansion to Improve GPU Thread Level Parallelism
[ICCD'2023] Z. Lin, Z. Mo, X. Huang, X. Zhang and Y. Lu. KeSCo: Compiler-based Kernel Scheduling for Multi-task GPU Applications
[LCTES'2022] T. Ge, Z. Mo, K. Wu, X. Zhang and Y. Lu. RollBin: Reducing Code-size via Loop Rerolling at Binary Level
[MEMSYS'2020] X. Zhang and E. Shcherbakov, DELTA: Validate GPU Memory Profiling with Microbenchmarks
[HPCA'2018] A. Gutierrez, B. Beckmann, et al, Lost in Abstraction: Pitfalls of Analyzing GPUs at the Intermediate Language Level
[HPCA'2016] X. Zhang, Y. Zhang, B. Childers and J. Yang, Restore Truncation for Performance Improvement in Future DRAM Systems