栗力的个人主页

即刻App年轻人的同好社区

下载

App内打开

栗力

238关注409被关注0夸夸

NLP 算法工程师，最近在搞刷榜
🦭生活愿景是"好乐无荒，及时休息"

栗力

2月前

以前只知道落后要挨打，从来没想到，做得太好也要被挨打！一个这么强的模型竟然要被雪藏，实在是太太太太太遗憾了😔

2 00

栗力

3月前

我们dots不愧是每天rednote逐页学习的孩子，网感一流🐶

5 01

栗力

3月前

一想到11月我要release什么就忍不住嘴角上扬！！！

2 00

栗力

6月前

招募顶尖实习生，诚邀大家推荐小天才！！

小红书 Hi Lab 基座大模型团队现面向 2025届及以后毕业的硕士、博士，招聘强化学习 (RL) 方向实习生。

核心信息：
薪资：硕士 2000元/天，博士 3500元/天。
课题方向：面向复杂场景的大规模强化学习系统。
团队背景：团队致力于大模型研发，近期开源项目为 DOT.LLM1。

你将深度加入以下方向之一：
1. Reasoning RL
2.Code Agent RL / Agent RL
3.Scalable Oversight (可扩展监督)
4.人文情怀世界奖励模型构建
5.Pretrain 与 RL 的深度融合

我们希望你：
1.对强化学习有扎实基础和浓厚兴趣；
2.具备优秀的动手实践和解决问题能力；
3.有钻研精神，渴望探索大模型与 RL 结合的前沿领域。

加入我们，你将：
1.获得极具竞争力的实习报酬；
2.深度参与开源大模型及下一代模型的研发；
3.在核心方向上独立负责，积累宝贵的研究与工程经验。

欢迎感兴趣的同学投递简历！邮箱：fdujyq@gmail.com

6 08

栗力

6月前

现在的大模型招聘风向导向了（只）招聘毕业3年内的人，各家出的顶尖实习生计划更是吓死人。了解到更夸张的，甚至大学生都看不上，要去招高中生。
理由是，年纪越大，“强化学习的程度太重了”。

我品味了一番。
是吧，年纪越大，思路的“熵”坍塌了，没有探索空间了，而新生代，可能采样效率效率更高（年纪轻可以使劲卷），探索利用的空间更大！

可是仔细想想，真的是这样吗？
如果非要把人做类LLM的比喻，那年纪越大，也可以说预训练学习的token更多，参数量越大，也是更有可能有“涌现”的产生呐！

但也可能大部分情况下，随着年龄的增长，garbage in garbage out，没有scaling law了，又或者是单纯地，硬件跟不上了。

一声叹息😮‍💨

3 00

栗力

7月前

dots.llm1.inst 是 Hugging Face 周趋势第十名！

1 00

栗力

7月前

今天是各地高考日，我们的模型也终于交卷了！
24的下半年，我在点点上进行了半年的摸索，虽然点点不够好，但是它偶尔的灵光，还是令人喜爱的。
25年，受到了r1的冲击，我意识到，围绕着产品做智能，是多么错误的一件事。我果断回到基座团队做自研模型的通用alignment，虽然此时就只有两人。
我坚定地要围绕智能做产品。
理论上，这是一个团队的活，但是小红书就是一个很“神奇”的地方🥹，硬是两个正式员工加一两个实习生，把这个活儿干了，而且看上去还尚可。
虽然大部分人不会直接使用instruct模型，但是技术报告证明了，大模型时代我来过，我花过的卡，排错的实验，白熬的夜，那么多的徒劳，也许终于有了注脚。
模型体验上，均衡取舍下，还是有所牺牲。但至少这是一个好的开始。
只要在行动，一切皆有可能！