即刻App年轻人的同好社区
下载
App内打开
歸藏
567关注27k被关注50夸夸
产品设计师、模型设计师、 不会代码的独立开发者。
关注人工智能、LLM 、 Stable Diffusion 和设计。
歸藏
1天前
搞了一篇万字长文,聊一聊 Skill,创作、分发、展示、边界,明天早上发
31
歸藏
1天前
我现在 Twitter 时间线上只有两类内容,非常诡异:

一种是充斥着所谓“一句话生成”的很漂亮的那种用 Fable 5 生成的网页;

第二种是除了 Anthropic 自家的 AI 研究员,全在抨击 Anthropic 这次发布 Fable 5 的各种行为。

这次 Anthropic 真是惹了众怒,几乎所有我关注的研究员都在骂他们。大家主要抨击的是以下几个问题:

安全风险

它的安全护栏极其严格。你哪怕问它最基本的初中生物学问题,都会被拒绝回答。这导致很多生物学研究员和团队无法获得正常许可来进行科学研究。

数据存储政策

Mythos Fable 模型的数据是明文储存且强制储存的,最高期限长达两年。虽然官方声称只用于安全分析和减少误伤,不用于模型训练,但业内没人相信这种说辞。因为这个条款的存在,微软已经禁止内部使用 Fable 模型了。

隐形降级(最严重的问题)

如果系统判断你想“蒸馏” Fable 模型,它不只是拒绝服务,还会偷偷摸摸地把模型降级到 Opus 4.8 或者更低的版本。甚至会通过修改提示词或微调等方式,暗中让 Fable 在相关话题上变笨,表现甚至还不如原生的 Opus 4.8。

大家最愤怒的点在于:

你要么帮忙,要么拒绝,假装在帮忙实际却故意把效果变差,这是一个非常严重的道德问题。这会直接污染一切基于该模型所做的算法效率比对和评估,导致现在根本无法用测试器对其进行正常评估。

实际上,这个政策对大公司和国家影响不大,受影响最深的是开源研究者、小实验室、独立开发者和科学界。

刚好达里奥(Dario Amodei)在昨天晚上新发的文章里,还在强调他们坚持透明、问责和公共机构监督。

但实际上他们拒绝一切监督问责,甚至反过来暗中破坏针对模型的评估和研究行为,这和他们宣称的完全相反。

所以,这次模型发布让 Anthropic 在业内的口碑一夜之间变得不如路边的一坨臭狗屎。
916
歸藏
2天前
笑死,藏师傅 PPT Skill 也上央视了,感谢腾讯云和 workbuddy
00:26
76
歸藏
2天前
CodePilot v0.56.0 发布

本次更新的部分修复由 Claude Fable 5 完成。

模型与渠道扩充版本

新增 Claude Fable 5、小米 MiMo UltraSpeed 模型与通用 OpenAI 兼容第三方渠道。

并修复用量统计、回复状态丢失、服务商列表刷新等一批问题。推荐所有用户升级。

github.com
10
歸藏
2天前
试了一下,Fable 5 在漏洞分析、bug 寻找这些地方还是很强的。

但是在写代码上,我感觉它也不是万能的,它写出来的代码也会有明显的 bug,需要多次修复才能完成。

所以在这块,我觉得它可能是一个偏科比较严重的模型。

在某些程度上它比 4.8 好了非常多,但在另一些方面,虽然也比 4.8 好,但好得有限。
01
歸藏
2天前
因为害怕额度问题,所以先让他找问题、写计划,没让他改代码。

结果发现他找问题找得老快了,而且也挺准的

歸藏: 在我 26 万行代码的 CodePilot 代码库中尝试 Fable 5,看一下它能找出多少问题

01
歸藏
2天前
在我 26 万行代码的 CodePilot 代码库中尝试 Fable 5,看一下它能找出多少问题
11
歸藏
3天前
我去!没想到 Anthropic Mythos 模型今天真的发布了。

不过他们这次发布的是 Mythos 的一个低配版本,命名为 Fable 5。

它的测评基准非常惊人,甚至比之前的 Mythos Preview 模型还要高。在 Agent Coding 方面,它的主要长处在于 Coding、Agent 以及工具调用,基准得分比 Opus 4.8 高出非常多。

关于 Mythos 5 Fable 5 的具体情况如下:

模型定位与权限

(a) Mythos 5 Fable 5 采用同一底层模型,但在特定领域解除了限制。 (b) Mythos 目前依然只为受信任的合作伙伴提供,优先开放给网络安全和生命科学领域的合作用户。 (c) Fable 5 现在已经开始向 API、Pro、Max、Team 及企业用户提供。

API 定价 (a) 输入:

每百万 Token 10 美元。 (b) 输出:每百万 Token 50 美元。 (c) 这个价格比原先的 Mythos Preview 便宜了一半。

安全防护机制

(a) Fable 加强了安全防护。如果系统判断请求可能涉及网络攻击、生化攻击或大规模能力蒸馏,它会直接拒绝服务。 (b) 一旦拒绝服务,系统会回退到 4.8 版本。官方称 95% 的情况不会发生回退。

订阅服务说明

(a) 官方表示,6 23 号以后,Fable 即使在订阅期内也可能会按量提供,不一定会直接包含在基础订阅包里。 (b) 但如果 23 号以后算力资源充足,官方会尽量将其包含在 Pro Max 等订阅服务中。

详情:anthropic.com/news/claude-fable-5-mythos-5
32
歸藏
3天前
才知道腾讯科技搞了这么个榜单。

​5 月的藏师傅排名还挺高,有点离谱,很难想象能排在这几个大佬后面。
130
歸藏
3天前
难道说?我感觉他们能做出来强制 kyc 才让用这种操作
20