职位描述:
1AI基座架构设计AI基座整体架构,涵盖知识库智能体平台大模型训推平台模型服务平台及算力调度平台,确保各模块高效协同。 2数据架构设计负责 AI 各平台的数据架构设计,包含时序数据库向量数据库数据湖的使用与规划。 3核心技术模块架构知识库架构设计知识库存储与检索系统,支持实时知识更新与上下文增强。智能体平台架构构建多智能体协同框架,支持工作流编排自主决策逻辑与跨平台交互。训推平台架构设计混合并行训练方案(数据/流水线/模型并行),优化分布式训练性能,支持千亿参数模型微调。算力调度架构GPU共享池化算法与异构算力调度系统,实现资源利用率最大化。 4工程化与性能优化制定AI工程化标准,包括模型版本管理监控告警A/B测试,构建从数据标注到模型推理的MLOps全流程体系。主导模型服务化架构设计,包括TorchServe/vLLM,实现模型动态加载弹性扩缩容与灰度发布,保障服务。 5跨团队技术指导为算法工程产品团队提供技术决策支持,解决分布式训练稳定性模型量化兼容性等核心技术难题。推动AI基座与行业场景的深度适配,输出技术白皮书与招投标技术标书。 6.跟踪AI前沿技术,规划技术演进路线。 1.专业背景计算机科学人工智能高性能计算等相关专业硕士及以上学历,5年以上经验,分布式系统并行计算成绩优异者优先。 2.技术能力架构设计精通PyTorch/TensorFlow分布式训练DeepSpeed加速框架,熟悉混合并行训练与模型压缩技术(量化/蒸馏)。 3.云原生与算力调度深入掌握Kubernetes容器编排资源调度算法,有集群管理经验。 4.熟悉多种智能体平台的应用如DifyRAGFlowLlamaIndex框架,熟悉RAG技术栈与Agent通信机制。 5.熟悉系统架构设计,有中大型 AI平台系统架构设计经验。 举报
1AI基座架构设计AI基座整体架构,涵盖知识库智能体平台大模型训推平台模型服务平台及算力调度平台,确保各模块高效协同。 2数据架构设计负责 AI 各平台的数据架构设计,包含时序数据库向量数据库数据湖的使用与规划。 3核心技术模块架构知识库架构设计知识库存储与检索系统,支持实时知识更新与上下文增强。智能体平台架构构建多智能体协同框架,支持工作流编排自主决策逻辑与跨平台交互。训推平台架构设计混合并行训练方案(数据/流水线/模型并行),优化分布式训练性能,支持千亿参数模型微调。算力调度架构GPU共享池化算法与异构算力调度系统,实现资源利用率最大化。 4工程化与性能优化制定AI工程化标准,包括模型版本管理监控告警A/B测试,构建从数据标注到模型推理的MLOps全流程体系。主导模型服务化架构设计,包括TorchServe/vLLM,实现模型动态加载弹性扩缩容与灰度发布,保障服务。 5跨团队技术指导为算法工程产品团队提供技术决策支持,解决分布式训练稳定性模型量化兼容性等核心技术难题。推动AI基座与行业场景的深度适配,输出技术白皮书与招投标技术标书。 6.跟踪AI前沿技术,规划技术演进路线。 1.专业背景计算机科学人工智能高性能计算等相关专业硕士及以上学历,5年以上经验,分布式系统并行计算成绩优异者优先。 2.技术能力架构设计精通PyTorch/TensorFlow分布式训练DeepSpeed加速框架,熟悉混合并行训练与模型压缩技术(量化/蒸馏)。 3.云原生与算力调度深入掌握Kubernetes容器编排资源调度算法,有集群管理经验。 4.熟悉多种智能体平台的应用如DifyRAGFlowLlamaIndex框架,熟悉RAG技术栈与Agent通信机制。 5.熟悉系统架构设计,有中大型 AI平台系统架构设计经验。 举报
- 你可能感兴趣的职位
- 最近浏览记录
-
0.6-1万/月
-
1-1.5万/月
-
0.8-1.2万/月
-
面议
-
0.8-1.5万/月
-
0.5-1万/月
-
面议
-
面议
-
¥4-10K/月
-
¥面议
-
¥面议
-
¥8-16K/月
-
¥面议
-
¥面议
-
¥4-5K/月
-
¥6-7K/月
-
¥6-8K/月
-
¥20-25W/年
- 公司规模:100 - 499人
- 公司性质:私营企业
- 所属行业:咨询/中介机构
- 所在地区:广东-深圳市-南山区
联系方式
- 联系人:徐斌
- 手机:会员登录后才可查看
- 邮箱:会员登录后才可查看
- 邮政编码:518000
工作地址
- 地址:深圳市南山区南新路大新大厦9楼901室
