职位描述:
岗位职责 1负责大模型训推平台,包括分布式训练框架混合精度优化断点续训等核心模块的架构设计与功能迭代,结合企业级客户需求,输出产品方案,如垂直模型微调特定知识库推理等方案; 2主导模型服务平台模型训练全流程管理推理服务弹性扩缩容等核心功能设计,确保平台支持多模态模型接入与复杂任务编排; 3推动训推平台与算力调度平台的工程化落地,设计资源调度算法,优化资源利用率; 4编写技术驱动的PRD,明确如训练吞吐量推理延迟等性能指标和验收标准,确保开发团队精准理解技术细节; 5通过客户调研提炼行业痛点,沉淀标准化解决方案,输出技术方案白皮书及竞品分析报告; 6设计产品商业化路径,如按Token计费私有化部署,支撑客户提案招投标; 7监控产品核心指标,包括训练任务成功率模型推理SLA,通过测试优化交互设计,推动产品竞争力提升。 任职要求 1.专业背景计算机科学与技术人工智能高性能计算等相关专业硕士或本科,5年以上工作经验及3年以上AI平台经验; 2.技术能力深度掌握大模型训推技术栈熟悉PyTorch/TensorFlow分布式训练DeepSpeed加速框架,能独立完成混合并行训练方案设计。模型服务化能力具备vLLM等模型服务框架的落地经验,熟悉API网关设计模型量化(FP16/INT8)及性能优化。 3.3-5年大模型产品经验,主导过至少1个企业级AI平台项目,需提供项目案例文档,含PRD技术方案性能报告。 4.熟悉政务云工业物联网等场景的AI算力需求,能快速定位客户需求与技术落地的平衡点 其他要求 1.具备极强的逻辑思维与结构化表达能力,能通过技术语言与研发团队高效沟通,同时以业务语言向客户传递价值 自驱力强适应快速迭代环境,对技术趋势(如AIAgent)有敏锐洞察力。 工作年限 举报
岗位职责 1负责大模型训推平台,包括分布式训练框架混合精度优化断点续训等核心模块的架构设计与功能迭代,结合企业级客户需求,输出产品方案,如垂直模型微调特定知识库推理等方案; 2主导模型服务平台模型训练全流程管理推理服务弹性扩缩容等核心功能设计,确保平台支持多模态模型接入与复杂任务编排; 3推动训推平台与算力调度平台的工程化落地,设计资源调度算法,优化资源利用率; 4编写技术驱动的PRD,明确如训练吞吐量推理延迟等性能指标和验收标准,确保开发团队精准理解技术细节; 5通过客户调研提炼行业痛点,沉淀标准化解决方案,输出技术方案白皮书及竞品分析报告; 6设计产品商业化路径,如按Token计费私有化部署,支撑客户提案招投标; 7监控产品核心指标,包括训练任务成功率模型推理SLA,通过测试优化交互设计,推动产品竞争力提升。 任职要求 1.专业背景计算机科学与技术人工智能高性能计算等相关专业硕士或本科,5年以上工作经验及3年以上AI平台经验; 2.技术能力深度掌握大模型训推技术栈熟悉PyTorch/TensorFlow分布式训练DeepSpeed加速框架,能独立完成混合并行训练方案设计。模型服务化能力具备vLLM等模型服务框架的落地经验,熟悉API网关设计模型量化(FP16/INT8)及性能优化。 3.3-5年大模型产品经验,主导过至少1个企业级AI平台项目,需提供项目案例文档,含PRD技术方案性能报告。 4.熟悉政务云工业物联网等场景的AI算力需求,能快速定位客户需求与技术落地的平衡点 其他要求 1.具备极强的逻辑思维与结构化表达能力,能通过技术语言与研发团队高效沟通,同时以业务语言向客户传递价值 自驱力强适应快速迭代环境,对技术趋势(如AIAgent)有敏锐洞察力。 工作年限 举报
- 你可能感兴趣的职位
- 最近浏览记录
-
0.6-1万/月
-
1-1.5万/月
-
0.8-1.2万/月
-
面议
-
0.8-1.5万/月
-
0.5-1万/月
-
面议
-
面议
-
¥面议
-
¥12-13K/月
-
¥20-28K/月
-
¥25-35K/月
-
¥4-10K/月
-
¥面议
-
¥面议
-
¥面议
-
¥8-16K/月
-
¥面议
- 公司规模:100 - 499人
- 公司性质:私营企业
- 所属行业:咨询/中介机构
- 所在地区:广东-深圳市-南山区
联系方式
- 联系人:徐斌
- 手机:会员登录后才可查看
- 邮箱:会员登录后才可查看
- 邮政编码:518000
工作地址
- 地址:深圳市南山区南新路大新大厦9楼901室
