基本信息
| 地点: 深圳 | 学历: 本科 | 工作年限: 3 年 |
岗位职责
1.从事视频世界大模型的研发,包括训练数据的设计和构造,基础模型算法的设计,针对预训练/SFT/RL相关的优化,模型能力的评测,各种下游应用场景的探索;
2.科学分析研发中的各种问题,找到模型性能的瓶颈,从第一性原理出发找到解决方案,加速世界模型的开发和迭代,确保模型的竞争力和领先性;
3.探索实现世界模型的不同范式,研究下一代的模型架构,探索世界模型的边界。
岗位要求
1.计算机、人工智能、数学等相关专业的全日制本科(优先)以上;
2.具有扎实的深度学习算法基础,具备扎实的大模型研发经验,有Diffusion Models和Autoregressive Models相关经验优先,有相关方向顶级论文者优先,有文生图文生视频实践经验者优先;
3.熟悉各类深度学习网络和算子底层实现细节,训练和推理模型调优,CPU/GPU加速,分布式训练推理加速,有实操经验优先;
4.有ACM竞赛、NOIP竞赛经历特别优先;
5.具备较强的学习能力、沟通能力、团队合作能力,有强烈的好奇心。
