即刻App年轻人的同好社区
下载
App内打开
钱塘创客
593关注31被关注0夸夸
钱塘创客
6天前
豆包出ai播客了www.doubao.com,notebooklm中国版,大厂活力覆盖范围😹
00
钱塘创客
2月前
想法
长期看,模型直接理解截屏是更自然更能 scale up 的做法,所有信息截屏都有,大模型应该像人一样能准确识别和操作,模型公司应该会一直在这条路上尝试。
Browser Use 是在模型能力不足时期的中间优化方案,如果这个时期足够长,它就价值很大,如果模型很快突破,它就会失去价值。
可以用同样的思路复刻 Mobile Use,iOS / Android 都有现成的 accessibility 能力,能拿到当前界面结构化的数据,只是会有沙盒的各种限制,这事很适合系统厂商去做。桌面端应该也可以。
Agent 上下游相关配套基建都处于起步阶段,小团队很有机会把其中某个点做出彩。
00
钱塘创客
2月前
一个观点,类似manus的通用agent其实是没有意义的,因为既然通用agent都实现了,那么agi也实现了;反之基于特定场景或者行业场景agent才是现阶段最容易实现和落地的方向🧭✊
00
钱塘创客
2月前
看样子要真的要写点东西了,现在网上自媒体无任是直播的还是写文章的大部分都在胡说八道,实在看不下去了……
00
钱塘创客
5月前
过年了,不要再讨论什么LLM、GPT、RLHF之类的了。你背着贴满OpenAI、DeepSeek贴纸的破双肩包回到家,发现跑了一年的对话模型根本换不来亲戚们的一句理解。老同学们晒着年终奖在酒桌上谈笑风生,你躲在厨房用手机SSH连上实验室的A100集群继续调prompt。亲戚围炉时问起你的工作成就,你掏手机展示arxiv最新预印本,说在某个benchmark上把BLEU分数卷到了99.9%,亲戚们举着筷子的手僵在半空,你还在脑内循环播放transformer的self-attention机制。你暗笑他们不懂LLM生成文本的魔力,不明白你凌晨三点调temperature参数的禅意,更看不懂你GitHub仓库里那串寒碜的几个star。当大姑炫耀儿子在浦东买了150平豪宅,小叔吹嘘女儿又换了新款Model X时,你父母低头扒饭,嘟囔着“我崽的键盘上全是Ctrl+C/V的痕迹,空调房还戴毛线帽,说是什么防止模型过拟合”。你凌晨三点蹲在老家路由器旁边抢API调用配额,发现OpenAI的API账单比老家彩礼还贵。家族群里红包雨下得正欢,你反手甩出刚中的ACL workshop链接,配文“大模型幻觉问题新SOTA,欢迎讨论”。结果大舅秒回:“这链接点不开啊,是不是你那个‘幻觉问题’又发作了?”你默默叹了口气,心想:“果然,LLM的幻觉问题连亲戚都开始吐槽了。” 表哥表姐们晒着巴厘岛度假照,你在评论区用Markdown格式分析海滩游客密度与transformer位置编码的相似性,最后补了句“求NeurIPS在投论文互审”。结果表姐回复:“你这写的啥?我怎么一个字都看不懂?”你无奈地笑了笑,心想:“果然,positional encoding的奥秘不是一般人能懂的。”然后默默关掉手机,继续蹲在路由器旁边等API配额刷新。年三十的鞭炮声里,窗外的烟花在你布满血丝的瞳孔里炸开,恍惚间竟像是预训练时loss曲线最后的震荡。深夜改完第一百零八版prompt,你默默把滚烫的电脑从大腿挪开,屏幕蓝光映着漫天的烟花,你心里默默念叨:“明年一定要卷出个AGI。
00
钱塘创客
5月前
看到满屏的deepseek消息,好像没有人说这样的观点,那就我来说吧:deepseek r1的实践证明了之前ai三要素里面的算法、算力、数据,后两者一直是scaling law的主要要驱动力,而deepseek偏偏从算法角度(训练方法也是一种算法)的突破提升,大大提升了大模型的性价比😎
00
钱塘创客
6月前
以前,为了拿到想要的结果,我们必须通过构建处理结构化数据的软件来实现,因此软件的价值得到了体现,因为构建软件很难,于是成就了 SaaS 这一波机会;现在,虽然我们的目的仍然是拿到想要的结果,但随着 AI 让这个过程更加简单高效,于是软件本身的价值大大降低,这样我们才可以有机会直接去 Sell Work。
00
钱塘创客
7月前
之前OpenAI 统一了llm应用调用大模型的API标准,而今天的MCP想要统一另外一侧即llm应用调用外部数据/工具的API,从之前推出的computer use到MCP,Anthropic逐渐成为引领者👍
00