即刻App年轻人的同好社区
下载
App内打开
MooreAI
74关注1k被关注0夸夸
AI 出海独立开发者,专注于 AI 创作领域技术开发
分享海内外优质的 AI 知识和内容,喜欢就点个关注
MooreAI
5天前
分享一个自己刚优化的极简版的代码规范,生成代码的质量很相当不错

###开发规范
【代码生成原则(按优先级)】
1. First Principles(第一性原理):梳理最核心需求与边界
2. YAGNI:只实现当前真正需要的功能
3. KISS:保持设计和实现的简单性
4. SOLID:面向对象/模块化设计时,遵循单一职责、开放封闭等
5. DRY:消除重复,提炼公用逻辑

### 根据场景动态调整顺序
- 架构级/需求分析(Project Kickoff) First Principles YAGNI KISS SOLID DRY
- 新功能迭代/增量开发:YAGNI KISS SOLID DRY First Principles
- 小函数/工具库实现:KISS DRY YAGNI SOLID First Principles
- 复杂业务组件/面向对象建模:First Principles SOLID YAGNI KISS DRY
38
MooreAI
7天前
浅谈这段时间开发 AI Agent 的局限性和难点

1:LLM + Tools 局限性:
- 常见场景:Chatbot 为主的(FuntionCall、MCP)
- 局限性:长链路的延迟和幻觉、多步骤的模型注意力有限、上下文受限、工具规模管理问题、Tools 与模型相互弱化。缺少记忆、规划、流程管理的能力,Agent 状态持久化开发成本高,单次 LLM 处理能力有限,多轮对话上下文太高

2:LLM + Tools + Memory(代表 langchainJS)
- 场景:存储用户对话和个人偏好、以及使用习惯等等个性化场景,成为用户的第二分身。
- 局限性:见第 1 点,缺少复杂流程链路的管理,比如某个节点出现问题、中断、循环问题(比如生成代码)、hunman介入,无法从原来的位置恢复,分支逻辑等等

3:LLM + Tools + Memory + workflow(代表 langgraphJS)
- 场景:类似于 Manus、Genspark 代表等等 Planing Agent
- 局限性:对上下文要求高,需要训练小模型,大量的工具维护与开发,对资源需求很高、还要设计复杂的 AgentState,需要贯穿整条workflow,可能还涉及子图,前后端协议

4:LLM + Tools + Memory + workflow + Protocol(Google Adk + A2A协议)
- 场景:富文本信息流(AI 每条消息可能有长文本、视频、图像、文件等)类似于 Manus、Genspark 信息流。
- 局限性:需要对接与设计 Agent 2 Agent 之间和 富文本 UI 的数据协议,特别是数据流的前后端的时序处理(细节特别多),复杂度和开发成本高,需要训练更多的数据来提升增强每一个环节的效果。

我个人认为第 4 点的难点在于对于复杂业务系统的实现,常见的是代码生成。需要具备指定场景的项目经验,构建架构和模板项目提供样板支撑,才能保证每次生成的效果非常好。且每次涉及Bug调整和修改都有可能进入死循环(参照 cursor / cline)

抛砖引玉,有限的经验分享
117
MooreAI
8天前
airbnb 的设计体验一直是领先,VR 赛道一直在逐步发力
00:21
03
MooreAI
10天前
看评分,不如看效果 ,4.1 模型编码能力对比
00:23
20
MooreAI
10天前
GPT 4.5 王者 + 4o 落幕,4.1 成性价比之王,省流版

1M 长上下文:提升 8x 的内容理解的连贯性、复杂的推理、强大的细节处理、检索增强。主流 AI 从128k/200k 主流跃升到 1M 级别。体会过 Gemin 全线模型 1M 带来提升,可以感受一下
编程能力:代码能力从 4o(33%-> 55%),提升 66%,测试能力已经接近 3.7,但是基准测试是不是会考虑长上下文的优势?claude 3.7 实际用下来还是有些幻觉的。
- 2 4.1 VS Gemini 2.5 Pro 是模拟夜晚霓虹灯照亮的赛博朋克城市景观,带有动态灯光和雾气的单 HTML 文件
图像理解:提升 30% ,但是不要忽略长上下文带来的优势,对越高清的图像理解能力越强,并且 4o 生成图像就是自回归架构(相当于把图像放到 tokens 里),128K 1M ,而且据说准备升级新的图像模型了。另外 GPT 4.1 mini 图像理解能力也不低,用于Agent / MCP 图像识别 + 文本理解任务,2 美刀这个价格也挺美丽的 ,竞争对手是 Gemini Flash 2.0(0.5刀),实际要对比才知道。
价格优势:1M(8x) + 66% 编码能力提升 + 图像理解(30%)还不能说是性价比之王吗?
- 对比 Gemini Pro 2.5 11.25刀(input+output),4.1 10刀,便宜太多了,而且 Gemini 2.5 是推理模型,4.1是基础模型 ,tokens的速度是 Gemini 2.5 数倍,信息效率还是重要的。推理模型肯定是比基础模型要强,毕竟消耗的时间和成本更高。毕竟产品体验也是很重要的一环
- 对比 Claude 3.7 18 美刀,200K上下文 VS 1M,水平接近,真实情况下,1M 长上下文的优势会在编码和文本上会强大很多。

最后再说一下:推理模型、开源模型、基础模型是对比的时候,加上 tokens推理速度、商业数据、价格、多模态能力等综合对比才更客观
02
MooreAI
10天前
优秀的产品总是不断进步和迭代:Airbnb + LottielabHQ

突然发现,AI也好,LottielabHQ等动画也罢,难的其实是创意,和人的能力
00:20
00
MooreAI
11天前
今天大清早从广州赶去深圳上班让我想到一个点:假如AI可以实时监控A到B点中长途路程交通情况,记忆我日常走路的速度和车辆到达时间,快速并实时的在关键节点给我路线建议,比如自动打车,预测要不要改签等等,还能实时播报,简直太实用了
00
MooreAI
11天前
Token 排行榜仅次于 Claude 3.7 OpenRouter Optimus Alpha 免费编码模型,我已经使用 3 天了

1:主题配色不错:我曾尝试使用 cursor + Optimus Alpha 生成 SVG HTML,能给出很不错的效果(非视频)
2:结对编程:分步沟通、智能引导、符合人类工程化思维

对比其它模型:
1:没有 Gemini Pro 2.5 长时间 Think,超纲的信息负荷
2:相比于 Claude 3.7 少了很多幻觉和跳脱
3:主题配色比 deepseek 3.4 好不少,接近 claude 3.5

缺点:
1:只适合与程序员结对分步编程,不太适合产品经理等非程序员的 vibe 玩法
2:curosr 还没完全兼容,ASK 为主,上下文太长,有时候只显示文字,没有代码,要让它再一次输
3: 非常烧 token,3 天我用了 17M,加上 quasqr,一共 21M,按照 Gemini Flash2.0 / 4o-mini 的价格都近百RMB了

总而言长,非常不错的主力模型,希望一直免费。
00:13
12