即刻App年轻人的同好社区
下载
App内打开
歸藏
565关注26k被关注50夸夸
产品设计师、模型设计师、 不会代码的独立开发者。
关注人工智能、LLM 、 Stable Diffusion 和设计。
歸藏
09:50
早上起来时间线上都在骂。

Anthropic 宣布说,不能用 Claude 账户中的额度使用 OpenClaw 这种三方的产品了。

他们会送你一个月的额度进行过渡,之后就得购买单独额度。

关于 Claude Code 的额度消耗异常问题,昨天也回复了,意思是不存在问题。

真太傻逼了,当大家傻子。

与此同时,Codex 不语,只是一味地重置额度。

Anthropic 也澄清了一下:在 Claude Code Agent SDK 上还是可以用的,只是这些非 Agent SDK 开发的产品不能用。

所以 Codepilot 暂时还安全。
73
歸藏
00:38
可以在 Codepilot 爽用谷歌新的本地模型 Gamma 4 了!

Codepilot 0.46.0 更新了 Ollama 本地模型的接入

启动 Ollama 安装 Gemma 4 就可以在 Codepilot 里面爽用了

但是在终端里很快,然后传输到 Claude Code 就很慢,不知道 Ollama 这个里边是不是有一些问题。
40
歸藏
2天前
阿里昨天发布了 Qwen 3.6 Plus 模型

重点是 Agent 和编码能力有非常大的提升!

最近也是很高产:先是 3.5 Omni、万相2.7、然后就是Qwen 3.6 Plus,而且好像马上 Max 也要发布。

在关于开发和 Agent 的一些测评上,现在 3.6 Plus 的模型相较于 3.5 有显著的提升。

Qwen 3.6 Plus 在图像和文件理解上的能力也获得了加强。

比如在以下方面的表现都非常好:数学图像识别体验、通用的 VQA 真实世界问答、OCR 能力。这也是 Qwen 之前比较强的地方。

更强的是,这次默认支持了 100 万上下文。最长输出接近 991K,输入是 64K。

100 万上下文的表现还是很顶的。在开发体验上,比原来的 256 要强非常多。

价格上,Qwen 3.6 Plus 的输入是 2 / 百万 Token,输出是 12 / 百万 Token。

此外,有些工具(比如网页抽取等)目前还是限时免费的。

现在已经在百炼上线了。后面那个阿里系的qoder、悟空啊都会上,希望他们能快点上一下 code plan 吧。

如果不太确定质量的话,也可以去 OpenRouter 那边免费体验一下,看看效果
11
歸藏
2天前
小米也推出了 MIMO Code Plan

最便宜的 39 每月,最贵套餐 659 每月

统一 Credit 点数体系,没有 5 小时限额这种设置

CodePilot 0.45.1 版本将会支持
63
歸藏
2天前
今天下午 2:00 4:00,在腾讯研究院这边直播
40
歸藏
2天前
Karpathy 分享了他如何构建本地的 AI 知识库,跟我用的方法也很相似。

都是用的 Obsidian,纯本地 MD,然后用一些反向链接、索引的方式把它们连起来。

他构建了一个用大语言模型驱动的个人 Wiki 知识库,然后把原始资料都丢进一个叫 RAW 的目录。

然后让大语言模型把这些原始资料编译成一个 Markdown Wiki,实现以下功能:自动创建摘要、创建索引、创建概念条目、添加相互链接、生成可视化等等。

我是在内容收集的时候就已经做好了,用的是 Obsidian 的那个剪藏插件。
在收集内容的时候,AI 就会自动进行以下处理:打标签、自动总结、翻译、创建摘要,目前就是还没有反向链接。

然后它的 Wiki 构建好以后,就可以在这个 Wiki 上提问,确保数据来源的可置信度。

比如说大语言模型会自己查索引、读相关的文档,写出回答或者报告,不只是在网页上搜。这样的话,它获取的信息基本上都是跟你相关的。

然后它的输出也尽量不是一句话,而是新的文件、新的可视化网页或者是 PPT,然后再回归到知识库里,让知识库越用越厚。

但这个会造成一个问题,就是 Obsidian 的作者也说了,这会污染知识库。所以最好把可靠性来源和 AI 生成的东西分开放。

还有一个比较好的点是,它会让大模型对 Wiki 做健康度检查。比如:找一些自相矛盾的地方、补发一些缺失的信息、发现一些新的关联、提高一致性。

其实现在很多人都是这样做的,我也把这套理念放到了 CodePilot 里。

关于助理文件夹的选择,我一般建议使用 Obsidian 文件夹。

如果你有自己的 Obsidian 文件夹,进去以后 AI 就会直接获取你所有的上下文和知识。

这样一来,你直接就能获得一个拥有完整记忆的 AI 助理。

如果你不知道怎么实践的话,推荐用 Codepilot 的助理试试。

把你的 Obsidian 文件夹放进去,让它帮你整理,同时让它把这些原则写到 Claude.md 里面。

详情:x.com/op7418/status/2039898050697839041
330
歸藏
2天前
谷歌昨天发布了 Gemma 4,这次非常牛逼!
专门用来在本地设备上跑 agent ,还支持多模态。

四个参数大小:
E2B:主打手机 / IoT / 边缘设备。
E4B:为移动端 + Jetson / 树莓派设计。
26B MoE:单次激活 3.8B,有效参数很小,主打高 TPS、低延迟。
31B Dense:全密集 31B,主打桌面工作站 / 单卡 H100 等。

这次他们把 Agency Workflows 的支持作为第一优先级:原生支持 Function Call、JSON 和结构化输出、System Instruction。

更强的是这玩意还是原生多模态模型,支持:图像和视频理解,语音转文本,可以做本地语音助手。

而且它们这次是真正的 Apache 2.0 开源,允许商用、再分发和内嵌产品,以及私有部署,没有额外条款。

谷歌还发布了一个安卓应用,来体验他们这次新发布的 Gemma 4 模型。

我用我现在的小米 17 Ultra 试了一下,在用这个 E4B 模型的时候,推理速度非常快。

而且这个 App 现在还内置了一个 Skills 的体验区域,你可以自己去让它调用工具编写和试用 Skills。

可以在 Google Play 搜索 Google AI Edge Gallery 下载使用。

详情:blog.google
37
歸藏
2天前
虽然出去玩了 10 天,但是效率还变高了,每天1.3 个版本

歸藏: 3 月 Codepilot 数据,下载量猛增

00
歸藏
2天前
3 Codepilot 数据,下载量猛增
42
歸藏
2天前
刚发现 TRAE 发布了独立的 SOLO 客户端。

而且现在有网页端和 PC 端两个了,你可以根据自己的需求选择。

内置的 Skills 市场可以选择适合自己的 Skills,每个 Skills 都有对应的介绍还有案例。当然你也可以创建自己的 Skills。

Solo 客户端里面有两个模式,点击左上角切换,名字很清楚:

Code 模式
一般是用来写代码的,涉及到开发的一些工程、任务,可以用这个模式。

MTC模式
主要是针对互联网工作中的非程序员群体(比如设计师、产品经理等),帮大家写文档、整理信息、搜集信息。

Solo 客户端右边的这个侧边栏比较有意思,里面包含了他所有的上下文参考信息,还有他生成的一些文档、PPT、网页等产物。

此外还有复杂任务,比如当你开启了计划模式,侧边栏会显示待办项目哪些任务还没有完成。

比如说我这里用它的 MTC 模式,让它检索我的 GitHub 项目中近期的所有 Issues。

然后,它自然地为每个 Issue 分了类,并大致介绍了每个的问题。

我又让他去查看里边的内容和信息,找到置信度高的、以及可以帮我修复问题的这些 Issues(也就是用户反馈)。

他自己制定了“置信度高”和“可修复性高”这种交叉的标准,定好标准后,就开始筛选这些对应的 Issues 了。

筛选得非常细,还分了“高执行度、高可修复性”以及“高执行度、中可修复性”这种交叉的分类体系,我看完以后就非常清晰了。

我还让他写了一个网页看板,去对他刚才获取到的用户反馈进行分类。他写得也很好,预览后可以非常清晰地看到:P0 、P1 、P2 的问题。

每个问题的执行度、可修复性以及问题详情都非常清楚。

现在好像还是内测阶段,免费使用,可以去试试
67