职位描述:
1.智能体架构部署与研发研究 负责智能体应用架构设计部署与落地,实现复杂业务场景下的大模型多轮对话与任务规划。 2.Skill / Tool 搭建与集成研究 编写并维护高质量的 API 接口,为大模型提供外部工具调用能力,实现 AI 与 OA数据库及本地文件系统的深度联动。 3.检索增强生成系统构建研究 负责基于本地知识库的文档解析向量化召回策略调优,提升大模型在垂直领域的回答准确率,降低幻觉。 4.性能调优与工程化 参与开源大模型的端侧轻量化部署与推理加速,优化应用层的端到端响应延迟。 1.博士研究生学历,必须是计算机科学软件工程等纯正计算机科学相关理工科专业。 2.有AI相关行业经验。 3.使用过Ollama 或 vLLM 在本地跑起过 Qwen或 Llama-3,用过 DifyFastGPT 或者 Coze 搭建过带分支逻辑的复杂业务工作流。 4.Agent 工程化落地能力。 掌握主流 AI 协议(MCPSkills 等)记忆系统(Memory)知识库(RAG),独立开发过具备一定影响力 AI 应用者,可以实现利用AI工具极大提升开发效率,并能设计出稳定可控可落地的Agent系统。 5.扎实的python编程功底。理解主流 LLM 能力与局限,能够清晰拆解任务并通过 LLM 或确定性逻辑兜底实现;熟悉主流大模型应用范式及主流 Agent 框架 ,具备大模型幻觉Prompt 注入等风险工程化应对思路。 举报
1.智能体架构部署与研发研究 负责智能体应用架构设计部署与落地,实现复杂业务场景下的大模型多轮对话与任务规划。 2.Skill / Tool 搭建与集成研究 编写并维护高质量的 API 接口,为大模型提供外部工具调用能力,实现 AI 与 OA数据库及本地文件系统的深度联动。 3.检索增强生成系统构建研究 负责基于本地知识库的文档解析向量化召回策略调优,提升大模型在垂直领域的回答准确率,降低幻觉。 4.性能调优与工程化 参与开源大模型的端侧轻量化部署与推理加速,优化应用层的端到端响应延迟。 1.博士研究生学历,必须是计算机科学软件工程等纯正计算机科学相关理工科专业。 2.有AI相关行业经验。 3.使用过Ollama 或 vLLM 在本地跑起过 Qwen或 Llama-3,用过 DifyFastGPT 或者 Coze 搭建过带分支逻辑的复杂业务工作流。 4.Agent 工程化落地能力。 掌握主流 AI 协议(MCPSkills 等)记忆系统(Memory)知识库(RAG),独立开发过具备一定影响力 AI 应用者,可以实现利用AI工具极大提升开发效率,并能设计出稳定可控可落地的Agent系统。 5.扎实的python编程功底。理解主流 LLM 能力与局限,能够清晰拆解任务并通过 LLM 或确定性逻辑兜底实现;熟悉主流大模型应用范式及主流 Agent 框架 ,具备大模型幻觉Prompt 注入等风险工程化应对思路。 举报
- 你可能感兴趣的职位
- 最近浏览记录
-
2-5千/月
-
3-5千/月
-
1-1.5万/月
-
10-20万/年
-
8-18万/年
-
8-18万/年
-
3-8千/月
-
5-7千/月
- 所在地区:广东-深圳市-南山区
联系方式
- 联系人:郑小丹
- 手机:会员登录后才可查看
- 邮箱:会员登录后才可查看
- 邮政编码:
工作地址
- 地址:广东省深圳市南山区粤海街道科技园社区科发路3号
