即刻App年轻人的同好社区
下载
App内打开
多元宇宙保洁员
12关注128被关注0夸夸
alanlee.fun
沟里人
骗子综合征重度患者
两只喵的铲屎官🐱🐱
NLP/Python 开发者
OW🎮/电影📺
置顶
多元宇宙保洁员
3年前
在这个信息洪流时代,大家都有什么方法做减法,让自己聚焦于某一特定领域而不过分发散?

比如定期取关一些公众号/大V等。
81
多元宇宙保洁员
4天前
所谓的“富不过三代”?

——《A Real Pain》
00
多元宇宙保洁员
4天前
和我的使用体验能匹配上,2.5 pro的工具使用能力真的很差,尤其是结合搜索时。
00
多元宇宙保洁员
6天前
llm 生成代码的一个特点是:过于“包”化。

它默认会当做你在写一个包,各种 init、try,层层封装,如果你看过一些大包的实现,就会很熟悉这套写法。

但实际上很多时候我们不是写包,这种做法反而会平增复杂度,每次写完我都要删掉大概 30%-50%。
00
多元宇宙保洁员
16天前
when is a machine not a machine?
00
多元宇宙保洁员
17天前
早晨的雨叶
00
多元宇宙保洁员
17天前
管中窥“prompt”😂
00
多元宇宙保洁员
18天前
au 的触手可及让很多人都以为自己已经懂 ai 了,甚至开始造词了
00
多元宇宙保洁员
18天前
00
多元宇宙保洁员
22天前
00
多元宇宙保洁员
22天前
刚读了下gpt-oss-safeguard的tech report,发现有些描述像是睁眼说瞎话:图1说两个safeguard模型表现基本与原版相当,然后在production benchmarks上的“certain categories”上性能有所下降。

但是请看图2:table 5中两者均只在2个category上比原版稍高,而在table 4中,也只有2-3个category比原版稍高,感觉这明显不行啊。

当然论文前面也说了,这个是在chat setting下进行的测试,这也是他们不推荐的用法。但是我觉得结论要和图表对得上,不能无中生有,玩hallucination。
00