职位描述:
1.在公司AI系统解决方案制定售前支持和项目落地中起到关键技术带头作。 2.AI系统架构设计主导智算集群(GPU/TPU/NPU异构计算)的系统架构规划,设计高吞吐低延迟的计算与存储方案,支持大规模模型训练与推理场景。 3.性能深度优化从硬件(芯片互联内存带宽)框架(PyTorch/TensorFlow)算法(模型并行策略)全栈协同优化,提升算力利用率(MFU)与能效比。 4.异构计算生态整合对接芯片厂商(如NVIDIA华为昇腾等),完成驱动固件计算库(CUDA/MindSpore)的适配与调优,解决跨平台兼容性问题。 5.技术前瞻与落地跟踪AI芯片(如存算一体光计算)液冷技术等前沿方向,推动创新技术在智算中心的工程化落地。 1.博士研究生学历,计算机科学电子工程应用数学等相关专业。 2.精通异构计算架构(GPU/TPU/FPGA),熟悉NVLinkRoCEInfiniBand等高速互联技术。 3.深入理解深度学习训练/推理流程,具备PyTorch/TensorFlow框架底层优化经验(如算子融合显存优化)。 4.掌握C++/Python,熟悉Linux内核机制,能通过perfNsight等工具分析系统瓶颈。 5.了解分布式训练框架(DeepSpeedMegatron-LM)。 6.具备技术领导力,能统筹硬件算法运维团队协同,输出高质量技术方案与专利。 具备以下专业能力者优先考虑 1.具备高性能计算(HPC)或AI系统研发经验,有智算中心云厂商AI平台建设经验者优先。 2.有AI芯片(如NVIDIA H100/H200华为昇腾910B沐曦寒武纪天数智芯的适配与优化能力)底层驱动或固件开发经验。 3.熟悉液冷系统设计绿色数据中心能效优化方案。 4.有千亿参数模型训练优化经验者优先。 举报
1.在公司AI系统解决方案制定售前支持和项目落地中起到关键技术带头作。 2.AI系统架构设计主导智算集群(GPU/TPU/NPU异构计算)的系统架构规划,设计高吞吐低延迟的计算与存储方案,支持大规模模型训练与推理场景。 3.性能深度优化从硬件(芯片互联内存带宽)框架(PyTorch/TensorFlow)算法(模型并行策略)全栈协同优化,提升算力利用率(MFU)与能效比。 4.异构计算生态整合对接芯片厂商(如NVIDIA华为昇腾等),完成驱动固件计算库(CUDA/MindSpore)的适配与调优,解决跨平台兼容性问题。 5.技术前瞻与落地跟踪AI芯片(如存算一体光计算)液冷技术等前沿方向,推动创新技术在智算中心的工程化落地。 1.博士研究生学历,计算机科学电子工程应用数学等相关专业。 2.精通异构计算架构(GPU/TPU/FPGA),熟悉NVLinkRoCEInfiniBand等高速互联技术。 3.深入理解深度学习训练/推理流程,具备PyTorch/TensorFlow框架底层优化经验(如算子融合显存优化)。 4.掌握C++/Python,熟悉Linux内核机制,能通过perfNsight等工具分析系统瓶颈。 5.了解分布式训练框架(DeepSpeedMegatron-LM)。 6.具备技术领导力,能统筹硬件算法运维团队协同,输出高质量技术方案与专利。 具备以下专业能力者优先考虑 1.具备高性能计算(HPC)或AI系统研发经验,有智算中心云厂商AI平台建设经验者优先。 2.有AI芯片(如NVIDIA H100/H200华为昇腾910B沐曦寒武纪天数智芯的适配与优化能力)底层驱动或固件开发经验。 3.熟悉液冷系统设计绿色数据中心能效优化方案。 4.有千亿参数模型训练优化经验者优先。 举报
- 你可能感兴趣的职位
- 最近浏览记录
-
2-5千/月
-
3-5千/月
-
1-1.5万/月
-
10-20万/年
-
8-18万/年
-
8-18万/年
-
3-8千/月
-
5-7千/月
- 所在地区:广东-深圳市-南山区
联系方式
- 联系人:郑小丹
- 手机:会员登录后才可查看
- 邮箱:会员登录后才可查看
- 邮政编码:
工作地址
- 地址:广东省深圳市南山区粤海街道科技园社区科发路3号
