招募顶尖实习生,诚邀大家推荐小天才!!
小红书 Hi Lab 基座大模型团队 现面向 2025届及以后毕业的硕士、博士,招聘 强化学习 (RL) 方向实习生。
核心信息:
薪资: 硕士 2000元/天,博士 3500元/天。
课题方向: 面向复杂场景的大规模强化学习系统。
团队背景: 团队致力于大模型研发,近期开源项目为 DOT.LLM1。
你将深度加入以下方向之一:
1. Reasoning RL
2.Code Agent RL / Agent RL
3.Scalable Oversight (可扩展监督)
4.人文情怀世界奖励模型构建
5.Pretrain 与 RL 的深度融合
我们希望你:
1.对强化学习有扎实基础和浓厚兴趣;
2.具备优秀的动手实践和解决问题能力;
3.有钻研精神,渴望探索大模型与 RL 结合的前沿领域。
加入我们,你将:
1.获得极具竞争力的实习报酬;
2.深度参与开源大模型及下一代模型的研发;
3.在核心方向上独立负责,积累宝贵的研究与工程经验。
欢迎感兴趣的同学投递简历!邮箱:fdujyq@gmail.com