即刻App年轻人的同好社区
下载
App内打开
阑夕ོ
311关注62k被关注31夸夸
知名IT人
😢这个人很懒,什么也没有留下。
阑夕ོ
1天前
战略定力换一个词就是懂得装死,不光是年初DeepSeek这波让很多明明有自研大模型的老板慌了神为了短期流量不惜引「狼」入室让渡品牌,早些年还有各种叹息腾讯错过了米哈游和二次元的压力,腾讯硬是没咬这个饵,现在米哈游自己问题一个接着一个,腾讯又出了三角洲⋯⋯

TomXu: 看了下 QM 数据,豆包的使用时长如果是 100 的话,DeepSeek 是 78,元宝是 15,其他去年的当红炸子鸡们,都不到 10。 还有些陪聊的,比如猫箱 星野 的时长也不错,比元宝高了 1-2 倍。 以上数据, 仅在移动端,没算 PC 电脑端。 BTW, 豆包占据网民移动端总时长的 9‱。整个纯 native AI 产品,总时长占比是 网民 3‰ 的样子。(不包括传统产品的 AI+服务) 不知道啥时候能破 1% 呢?🤷‍♂️

31
阑夕ོ
1天前
就业形势有多严峻呢?在一篇报道老年人退休后重新艰难找工作的稿件评论区,最普遍的声音不是同情或是鼓励,而是认为这些有退休金的老人不应该还和年轻人抢工作。
3310
阑夕ོ
1天前
辛顿来WAIC推销AI安全论有一点必要但也没有那么必要。
02
阑夕ོ
2天前
一个游戏能炸出潜伏在静好社会里的如此多的皇汉,也算功德无量了。
181
阑夕ོ
2天前
去年中国公有云总共调用114.2万亿Tokens,Google云今年6月调用了980万亿Tokens。
143
阑夕ོ
3天前
短视频里的奶牛猫各种萌蠢节目效果炸裂,真养起来才知水深火热,那些异常表现实际上都是生理性惊惶,永远对环境充满警惕,哪怕是养得再熟,也会对任何动静抱以大敌,一言不合就断水伤肾,心累。
52
阑夕ོ
3天前
继两个月前通过副主任医师职称考试后,夸克健康大模型又通过了12门学科的主任医师笔试评测,并且夸克已经把该「主任级AI医生」能力全面集成至夸克的AI搜索中,这意味着夸克进一步实现了每人都能有个AI医生的愿景,还是那句话,我就感觉到快。

从数据上看,夸克在这轮测试中67.7%的准确率比第二名高出了近30个百分点,领先不可谓不大,但我真正关心的不是数据,而是相比于五月那轮副主任医师测评,夸克通过推理难度高出几个级别的主任医师考试,到底能为医学领域做多大的实事。

健康大模型不是夸克开创的概念,目前市面上的同类产品以TO B为主流,商业化路径十分明确,不是说这样不好,而是这些大模型性质,决定了它们难为大众所用。

在让AI做题蔚然成风的环境里,大模型的能力边界是一回事,这种能力最后究竟能不能投入到市场变成公共服务,又是另外一回事了。

比如在AI医疗这个母题上,中国最亟待解决的是医疗资源的分配问题,这与其他国家的处境是截然不同的。比如在移动互联网时代,有很多APP和账号都在尝试跑通线上问诊,也不乏类似丁香医生这种已经搭建了一个成熟体系的账号跑出来,但这种模式,仍然没有改变问诊背后在消耗「人」的本质。

搜索引擎当然也尝试干过这事儿,结局也很明显,传统搜索早已被清扫进了历史垃圾堆里,而新兴如小红书这样「人传人」式看病不仅高度依赖经验,准确率也难以保障。

夸克披露了一个很值得细品的数据,就是在产品上搜索医学类考试题目的人数已经突破200万,考虑到非医学生做这种动作的可能性并不大,所以从纯度上讲,中国医学生已经有超过半数在用夸克学习了。

这当然很大程度上能说明,夸克在医学领域数据库的参考价值起码是得到专业人群认可的,不过这不是重点,重点在于夸克通过主任医师评测的考试,证明了其拥有了接近主任医师级别的的思维,AI已经可以完成医学领域的智能化延伸了。

如果你觉得这个说法过于抽象的话,不妨看看前段时间量子杂志刊登过的一篇报道:

美国的一个物理学团队想让AI帮忙设计一款引力波探测器,在没有任何预设的前提下,AI输出的结果让一票物理学家一脸懵,因为这东西实在不符合常理,牵头的领导当时还把这个结果定性成了「一团糟」。

结果过了几个月,研究人员才发现AI的思路,其实是基于几十年前俄罗斯物理学界的一些理论构建出来的,研究越深入,就越能证明AI给出的这套方案,居然是效率最高的...

这就是智能化延伸的能力,AI发展到今天,早已经跳出了「有问必答数据库」 的那套叙事,它如今最大的价值,是给有局限性的人类提供无数可能的思考角度,就像当初世界围棋大师们都看不懂AlphaGo的路数,但后者最终总能赢下对局。

说回正题,在智能化延伸能力的基础上,夸克的推理能力,已经可以取代绝大多数医学上的机械性重复工作,比如分析血常规、看CT影像等等,只要喂料够多,那最终的准确率一定不会比真人医生低。

更重要的是,这种延伸背后是千万级DAU的搜索入口,单是医疗领域,夸克的升级也能直接覆盖到2000万体量的用户群体,实打实影响着每一位正在用AI辅助问诊的人。

当然,这只是个开始,夸克的质变,也是建立在整个行业大模型能力都在突飞猛进的背景上的,AI要想真正参与到医疗体系里,要经历的步骤还有很多。

不过还是希望AI厂商们能更多向类似务实的方向上靠拢,有时候做慢而正确的事,最终的收获,要比想象中多很多。
1216
阑夕ོ
4天前
今年的AI Coding实在是太热闹了,缺席的大模型厂商基本可以被开除出第一阵营了。

昨夜今晨的沸腾终于轮到了阿里,Qwen-Coder登顶全球开源模型编程榜,性能对齐Claude 4。

其实Qwen这么晚才下场反而是我比较在意的,好在晚有晚的好处,那就是准备充分,因为训练得足够熟练,Qwen-Coder在实际工作时能调用的工具量是远高于Claude 4的,非常有助于效果的追赶。

是的,在模型层,Claude 4的编程能力依然是最能打的之一,唯一的问题就是贵,前几天看到一个程序员整活,给Claude 4配了一台设备,授予控制权供它自由发挥,一天下来最大的乐子是收到了几百美金的新增账单⋯⋯

不过因为AI Coding的杠杆性,对于模型成本的考虑在此前并没有太高的优先级,毕竟和时间成本相比,单月几十美金的标准费用已经很划算了,所以AI Coding几乎是这波AI浪潮里最早也是唯一具有盈利确定性的赛道。

但在Agent时代到来之后,Tokens的消耗眼看着呈指数级增长,被「智能带宽」卡脖子的情况必然会出现得越来越频繁,Qwen-Coder主打「同性能价位最低、同价格性能最强」,多少有些白衣骑士的人设。

这也可能是第一个为Agent而生的编程模型,看报告就知道了:

「Qwen3-Coder具备出色的Agent能力,尤为擅长解决多步骤的长任务,它能通观全局自主安排工作内容,支持Agent调用各种工具深入钻研,最终解决复杂编程任务,基于Qwen3-Coder,网页开发、AI搜索、深度研究等智能体应用将变得更智能、更高效。」

一句话总结,就是旧的市场他强任他强,新的市场必有我的一顶王冠。

就像Qwen家族已经是全球下载量最高的来源模型,Qwen-Coder也要用质价比这张王牌,继续降低编程门槛,打破20美金/月起步、200美金/月能爽的约定俗成,让更多的普通人也能享受数字造物的乐趣。

还有一个细节是,Qwen-Coder的API是能和Claude Code、Cline等工具协同使用的,这已经不是「三个臭皮匠胜过诸葛亮」了,而是把三个诸葛亮凑在一起搞末位淘汰制⋯⋯

只要价格能打下来,专业的程序员完全可以自由组建「AI员工矩阵」,择优验收各自最擅长交付的工作成果,获得以前想都不敢想的生产力。

就像黄仁勋前几天来中国时讲自己是怎么把AI当牛马用的,他会同时用ChatGPT、Gemini、Claude和Perplexity四个产品,每次有需求就同时发给它们,然后把各自的答案交叉返回过去让AI参考,由此提高结果质量。

我很认同他的观点:「我认为未来这也是一种安全机制——你会有很多不同的AI,它们之间会形成冗余、平衡和交叉验证的机制。」

目前Qwen-Coder的定价策略是根据输入/输出的Token数阶梯计费,差不多是Claude 4的1/3,刚看到阿里又搞了限时5折的优惠,只能说所有编程模型接下来都不太能睡得着觉了,太猛了!
715
阑夕ོ
4天前
是不是每个省的民间都有「省会城市吸干了全省的血」这个怨言?
21711
阑夕ོ
5天前
健身房的运动单车坐垫怎么都又窄又硬,前列腺都快被崩裂了。
174