职位描述:
岗位职责 1. 参世界模型微调与创新开发,重点优化动态场景生成的时序连贯性几何一致性,探索自回归扩散模型在未来帧预测中的应用。 2. 整合文本图像动作轨迹等多模态数据,构建适配世界建模的训练数据集,实现文本指令对动态场景生成的精准控制,提升模型对复杂场景的理解与生成能力。 3. 参与开发模型部署调优的自动化工具,优化模型推理效率,适配分布式训练框架提升研发效率。 4. 负责模型效果的量化评估与可视化验证,针对动态场景生成中的物理规则一致性长时序列稳定性等问题开展迭代实验,记录实验数据并输出分析报告,支撑核心算法的迭代优化。 5. 技术调研与沉淀跟踪世界模型扩散模型领域的前沿进展,调研行业主流方案与开源工具。 1. 在读博士学历,实习时长不少于4个月。 2. 精通Python编程语言,熟练掌握PyTorch深度学习框架,具备扎实的神经网络与扩散模型基础,深入理解Stable Diffusion核心原理及生态工具。 3. 熟悉至少一种分布式训练框架(FSDP/DeepSpeed/Megatron)或模型推理优化技术(xformersbitsandbytes量化),有AI模型训练部署及性能调优经验者优先。 4. 具备良好的数学基础(线性代数概率论),了解世界模型核心概念(如时序预测动态场景建模多模态融合),对视频生成3D场景建模有兴趣者加分。 5. 具备较强的问题解决能力逻辑思维与沟通协作能力,能主动推进实验落地,有独立完成技术调研与小模块开发的能力。 举报
岗位职责 1. 参世界模型微调与创新开发,重点优化动态场景生成的时序连贯性几何一致性,探索自回归扩散模型在未来帧预测中的应用。 2. 整合文本图像动作轨迹等多模态数据,构建适配世界建模的训练数据集,实现文本指令对动态场景生成的精准控制,提升模型对复杂场景的理解与生成能力。 3. 参与开发模型部署调优的自动化工具,优化模型推理效率,适配分布式训练框架提升研发效率。 4. 负责模型效果的量化评估与可视化验证,针对动态场景生成中的物理规则一致性长时序列稳定性等问题开展迭代实验,记录实验数据并输出分析报告,支撑核心算法的迭代优化。 5. 技术调研与沉淀跟踪世界模型扩散模型领域的前沿进展,调研行业主流方案与开源工具。 1. 在读博士学历,实习时长不少于4个月。 2. 精通Python编程语言,熟练掌握PyTorch深度学习框架,具备扎实的神经网络与扩散模型基础,深入理解Stable Diffusion核心原理及生态工具。 3. 熟悉至少一种分布式训练框架(FSDP/DeepSpeed/Megatron)或模型推理优化技术(xformersbitsandbytes量化),有AI模型训练部署及性能调优经验者优先。 4. 具备良好的数学基础(线性代数概率论),了解世界模型核心概念(如时序预测动态场景建模多模态融合),对视频生成3D场景建模有兴趣者加分。 5. 具备较强的问题解决能力逻辑思维与沟通协作能力,能主动推进实验落地,有独立完成技术调研与小模块开发的能力。 举报
- 你可能感兴趣的职位
- 最近浏览记录
-
面议
-
3-9千/月
-
4-6千/月
-
5-7千/月
-
面议
-
0.7-1.5万/月
-
0.5-1万/月
-
4-7千/月
