即刻App年轻人的同好社区
下载
App内打开
Tefnut
434关注262被关注4夸夸
🧑‍🏫ENTP-T 6w7
🗂在和遗忘做抗争
💻CS PhD/Al4Science->Structural Biology
Tefnut
4天前
2025 年下半年了,Deepseek更新了V3.1,自媒体们还是在拿原来的测试测一遍。

不应该着重看看Agentic的表现吗?
11
Tefnut
4天前
提示词文学是我没有想到的
00
Tefnut
5天前
很多人在说为什么应该发展一人公司,但在我看来,这也许会成为一种不得已的选择。AI Agent本质上是在把人的智识抽取为公司的生产资料,人们只能通过拥有自己的公司来通过这些生产资料来持续获取收益。
00
Tefnut
9天前
Windsurf被Devin收购之后果然深度集成了Deepwiki。
00
Tefnut
12天前
Gemini 2.5 Pro在命理分析上真是一骑绝尘,Deepseek R1 弱一点。non-thinking模型做不来,Anthropic的所有模型在这件事上一团糟,OpenAI的模型拒绝命理分析。
00
Tefnut
16天前
在Cursor里用了半天GPT-5,总体觉得它很务实,没有什么灵光一现的时刻,但是交代的内容能基本按预期完成,agentic调用非常流畅,在我心目中很接近Claude Sonnet 4 了,不知道GitHub何时能将其作为默认。大概OpenAI也发现了,还是得先苦一苦AI,让AI去当工具,当工具的人才能回去当人。联想到Cursor将其免费一周,大概率这也是要被用来制衡一下Claude的溢价。

我现在是越来越不看SWE-Bench这种评测了,智能分好几种,我只需要LLM能贯彻我的意志,至于我的意志,那是我不能放弃的东西。每一次我想放弃我的主体性,只是用Wispr Flow胡诌几句都会被眼前的一堆垃圾教训。我没有责怪它的意思,它至少能记得我让它记忆的东西。

我看很多人说GPT-5 变得没人味儿了,这跟它幻觉减少大概率是相关的。能够做梦不也是一种智能吗?但这不是我们希望它拥有的智能。就像老板在DDL面前也不希望我太挑剔一样。
01
Tefnut
1月前
以前总是为web clipper烦恼,现在直接复制了扔给Gemini 2.5 Flash重新按照Markdown格式排版。
00
Tefnut
1月前
Kiro的specs好用,但是免费的claude sonnet 4.0 太慢,如果能切换成Kimi K2 就好了。
00
Tefnut
1月前
kimi k2 带飞groq,相比claude蠢一点没关系,快速迭代体感更好。
00