即刻App
年轻人的同好社区
下载
App内打开
misc
1k
关注
17
被关注
0
夸夸
misc
26天前
世贸组织还活着?
少即是多:
0
0
0
misc
1月前
受益人是谁
潘乱: “全世界最好的商业模式,那就是国家。国家是最好的商业模式,地不是它的,但它可以卖地,不管多大的企业,都要交税。”
0
0
0
misc
3月前
大模型之前数据标注行业没有诞生大公司,scale.ai可是大模型之后才有的
RyanHh: 说一个挺残酷的事实,AI大模型实际上在颠覆数据标注行业,以往大厂会自建或外包标注团队,而大模型不管是效率还是质量还是成本,都对比人工有优势,已经在进行中了…
0
0
0
misc
3月前
不敢真吵,怕被360环评,怕被穿小鞋 //
@玉伯
: 大厂往往是假吵
玉伯: 最近感觉最幸运的一件事 就是敢和创业伙伴吵架了 吵完后 更知道了彼此在乎什么 挺好的 创业最怕的就是 不吵架 万事皆好 如同在大厂一样 那就惨了
0
0
0
misc
3月前
世上无难事,只要肯放弃
玉伯: 只要敢于舍弃 很多事情就没这么难
0
0
0
misc
3月前
感觉这两个还会是趋势 继续attention加速、让模型有记忆能力(你说的边推边学包含这个吧) //
@罗X
: test time training
罗X: 今年的趋势 1、端侧模型,替代云端token 2、边推边学,替代纯推理 3、保密
0
0
0
misc
3月前
功能确实做的稀碎
orange.ai: 小宇宙的VIP会员真是冤枉钱 AI功能做的稀巴烂 还不如把开屏广告5秒去掉
0
0
0
misc
3月前
英伟达 是不是又得小跌一下
歸藏: Deepseek 开源周第一天:FlashMLA项目 让H800的计算性能翻了两倍!! 为Hopper架构GPU开发的高效MLA解码内核 专门针对可变长度序列进行了优化 H800上可以达到 3000 GB/s的内存带宽和580 TFLOPS的计算性能 项目地址:https://github.com/deepseek-ai/FlashMLA
0
0
0
misc
3月前
李飞飞 团队论文进一步验证,SFT精挑细选1千条样本就能让效果不错,不用那么多,说明从个人提升角度,绝大多数事情都是无意义,只有极少数才能从中获得提升
徐文浩: 其实 R1 的训练过程和人的学习成长特别像。SFT Memorize,RL Generalize。所以打工别打太长时间,学会了基本格式就尽量去真实世界RL就好了。 模型需要非常好的 Pre-Train,并且数据质量要高。对人来说,就是要好的通识角度,博览群书,啥科目都要看看,而且要多看教科书,少看低质量短视频和网络帖子。 然后 SFT 帮助你能够强化记忆和能力,基本上大家专门学习特定的专业,以及去大厂打工都是这个逻辑。在某一个领域还是需要监督学习,做题也好,在公司里收到立刻短时过程反馈。 但是 SFT 有个缺点,就是 Overfit,一旦遇到分布外的数据表现急剧下降。所以如果一门心思在大厂打工,习惯了短时的公司内反馈,一旦遇到现在这种行业大变化,离开大厂就会非常痛苦,实际解决真实世界问题的能力并没有那么好。 但是 RL 有很强的泛化能力,所谓人教人不会,事儿教人一教就会。融资创业也好,做个小生意也好,被“稀疏奖励”的现实世界抽两个大嘴巴子立刻就成长了。 但是完全从 RL 学习又很难,所以 RL-Zero 那种一毕业就创业还是很难的。最好是先简单 SFT 一下,拿一点“格式奖励”,学会做事情的基本套路,再跑出来让现实世界对自己打脸。不过千万别长期SFT下去。 Pre-Train => 简单SFT => 然后依赖RL 可以获得最好的泛化能力。
0
0
0
misc
4月前
"我有一个暴论:良好的合作不需要靠私人关系来维系。" 需要找到一个好组织
鲁彼特: 有的人,你合作过一两次就知道,这个人大概率不会有什么上升空间。 说的更直白点,职场上没有晋升机会,生意场上别人不会给合作机会。 但对方往往自己是不清楚的,还以为是不是厚黑学读的太少,是不是还不够精明,不够功利,关系没搞到位啊。 其实原因很简单,如果把人比作一个产品,这个人给别人的用户体验很差。 完全没有受人之托,忠人之事的感觉。把零和博弈嵌入了骨子里。 大概是预训练的时候吃了太多脏数据,也没经过监督微调,篡改奖励函数通过测试,就走上社会了。 但反正凑合着当个人力用吧,但往上就很难。 本质是不懂如何在共赢的框架下拿到结果。以为成功就是靠搞关系。 这是山脚下的人看山顶时的臆想。 我有一个暴论:良好的合作不需要靠私人关系来维系。 之所以发展私人关系,本质是因为契约不完备,信息不对称,道德风险很高。 但如果你足够聪明,又善于营造共赢机会,让别人自然而然披露私有信息,你不需要去搞关系,也能办成各种事情。 这样的人,在任何组织里都是宝贝。 这才叫领袖才能。能够让集体利益最大化,在这个前提下,实现自己的利益。 你看,就算是阐教里的反派无量仙翁,他也是在最大化阐教弟子的利益,不惜去干脏活,背骂名。他对人类和妖族是反派,但对他所在的组织,可谓是问心无愧。 绝不是干一点活就马上要回报,这只是追求个人利益最大化。结果就是牛马命(巴不得领计件工资),不是拿王子/大女主的剧本。 推荐去看《最强大脑第九季》,提出了人类最高级智慧 level k 的标准:不止自己足够聪明,能够完成任务,还要帮助集体完成任务。 而且这些选手大都是第一次见,没有什么私人关系。并不妨碍他们达成合作! 这才是向上走的终极之道。 算了,蠢可能没什么办法治。
0
0
0