即刻App年轻人的同好社区
下载
App内打开
行小招
81关注140被关注0夸夸
探索AI在企业的落地应用场景
记录关于大模型的一切闪念、想法、洞察
Nasdaq上市公司|增长技术负责人
前阿里/同程艺龙
置顶
行小招
2月前
我目前对 AI 的理解,有三个层次:

1. 个体赋能层 (AI as Copilot) :AI是工具、是 copilot,辅助你提高在某个具体任务中的效率,拉开人与人之间的差异。

2. 组织变革层 (AI as Colleague):AI是团队成员、是“新人”、是同事,单独解决某一具体任务而不需要你的协助,这将对现有的团队、组织带来极大的变化。

3. 认知突破层 (AI as Catalyst):AI是精神伴侣、人生导师、扩大自己的认知边界,许多现在做不了的事情,比如癌症(人类疾病)、可控核聚变(能源问题)、太空探索等都可以做了,这将对人类世界的科技进展、文明程度带来极大的升级。

详细阐述如下:(经 Gemini 2.5 Pro 润色)
11
行小招
13:34
从能够高效协同的工具列表看,GPT-4o vs O3 日常怎么选择使用

GPT-4o 能够使用 8 个工具,包括记忆、代码、搜索、图片生成、cavas,

O3 能够使用 12 个工具,除了 GPT-4o 能够使用的工具外,搜索工具的能力大大增强,额外有个数据分析图表制作的 python_user_visible 工具,有任务相关的工具、有用户当地信息(位置/本地时间)工具,

PS:
我个人判断,O3 降智会更简单,他本身就知道用户的当地信息,位置、本地时间,在这个地方做一层对齐,直接封禁不允许的地区,就更简单了。
00
行小招
10:09
三天假期做了一个决定,今早升级了 ChatGPT PRO 会员,200 刀,暂定一个月,月末复盘,看看这 200 刀值不值。

即友们,你们升级 ChatGPT PRO 会员的原因是啥?能不能一起讲讲,

我个人就是为了 Deep Research GPT-4.5 的次数,这俩目前是工作、生活中重度使用的了,GPT-4.5 的对人性、知识的理解深度,底层逻辑的深刻洞察,4o、O3都不够,Gemini 2.5 Pro 也不足,而且 GPT-4.5 写文案绝对是一流的,目前我个人觉得最强(O3、Gemini 2.5 Pro、Grok3、DeepSeek-R1-0528)
100
行小招
4天前
的确是这样的,trae cursor 在我身边受Java 开发的欢迎,就是界面更符合 idea 的操作,debug 过程还是比不上 idea ,很多开发是在 trae 写代码,使用 idea debug

如果阿里的这个把 Java 开发、debug 的体验提升起来,那么 idea 真的可以被替代了;

池建强: 阿里发类 Cursor 的 IDE 了。我觉得或许阿里可以为 Java 的用户额外做些什么,毕竟目前阿里是 Java 大户,国内 Java 的占有率也非常高。 Cursor 这样基于 VSCode 魔改的产品,原生对 Java的支持没那么好。这或许是一个阿里牌 IDE 体验反超的 切入点。

01
行小招
5天前
Artificial Analysis三方评测:deepseek-R1-0528 智能总分数达到 68 分,超越 Gemini 2.5 Pro、Grok-3-mini、Claude Sonnet 4,仅次于 O3/O4-mini-high,差距非常小。

R1-0528 架构没变,依然是 MOE总 671B,激活参数 37B,在 V3 的基础上采用 RL 进行 post-training。

详细:x.com
00
行小招
5天前
暴论: Dify 之于开发AI Agent应用,类似于 Java 生态中的 spring cloud,学习 AI 应用开发的同学,应该战略性重视起来。

目前我知道的很多企业自建 AI 应用的,大部分都是使用的 dify,中国人开发的,符合国人习惯,RAG Agent workflow 等功能非常强大;

开源项目类: n8n(偏自动化 workflow)、Langchain-Chatchat、fastGPT、Flowise、RagFLOW 这些开源项目,功能完备度、社区积极性、人员成本、可扩展性等等各有差异,

框架类:LangGraph、AgentsSDK(水土不服)、Langchain(控制性太差)、AutoGen、CrewAI、llamaindex(偏 RAG)等知名框架,不说功能全不全,在企业内部落地,需要大量的开发工程师,大量的工程代码,成本高。
00
行小招
5天前
再来几个 lovart.ai 的邀请码,需要的自取,先到先得。
ygueaSR
jDNnhLh
g4Np87Z
L4YkvZY
NJTLExT

行小招: 我看有好多小伙伴需要Lovart AI 邀请码,也发一下,需要的自取。 3HyVJQ2 Dv3gVXk 326tutG

00
行小招
6天前
我看有好多小伙伴需要Lovart AI 邀请码,也发一下,需要的自取。

3HyVJQ2
Dv3gVXk
326tutG
51
行小招
6天前
没想到 Gemini 2.5 Pro 的多模态理解能力这么强!这个 case ,思考几秒钟超过 ChatGPT o3 4 分多钟思考,

上班路上看到一辆车,没任何车标,真没有,我自己是超车超过去看到了车轮子上的车标,再去搜索找到的,答案就是“长安起源 E07”,Gemini 2.5 Pro 这一个 case 直接封神了!

这个 case 的难点,需要根据车型,外形,尤其是后部分的形状,从自己知识库或者网络搜索的内容中找合适的,然后再推理、判断是哪个车型,

o3 非常卖力,把图片放大了缩小,反复搜索,最终还是失败,而 Gemini 2.5 Pro 上来就对了,大家可以看看他俩的思考过程,非常有意思,

我猜测 Gemini 2.5 Pro 能答对的原因在于其训练的语料库,知识库截止 2025 1 月份,o3 截止 2024 6 月份,差了半年的训练语料,还有就是 Gemini 2.5 Pro 是真的原生多模态,训练语料里面含有很多图片、视频类数据,应该是看到过汽车车型的数据
20
行小招
9天前
Claude 4 发布了几天了,论坛上基本上都是“牛逼”的声音,“牛逼”到啥程度了,livebench.ai 的这个纯客观的评测分数,可以看看。图 1-3

1、综合排名,有了很大的提升,opus 4 位居第 2;
2、code 排名,Claude Sonnet 4 Claude Sonnet 3.7 差距不大,都是第一梯队;

当然,这个评测的维度,主要看模型第一次**Pass @ 1**回答的正确性,而不是需要不断交互后最终回答效果,所以和人的体感 vibe coding 还是有些差别的。

详细 coding 评测逻辑,参考图 4;
00