即刻App年轻人的同好社区
下载
App内打开
黄龙教主
137关注63被关注0夸夸
即刻当日记随便写写,反正也没人认识我
黄龙教主
4月前
准备二次创业 mark
30
黄龙教主
7月前

Kenny_肯尼: 这几个月对Claude Code的逆向、架构分析的博客很多,但这篇依然写得很棒,作者vivek 过去几个月一直在使用和调试 Claude Code,并且编写了一个记录器,用于拦截并记录每一个网络请求。然后基于自己的使用经验以及截获分析的所有日志,对Claude code进行了深度的剖析。 《Claude Code 为什么这么牛!? 》https://ybzavo65ti.feishu.cn/wiki/V6yYwGPIfiEEywkvxkicbKQEnlf?from=from_copylink 原文比较多内容,我摘取其中一些关键的信息,有些地方我最近做agent也有共鸣 1. 保持简单:Claude Code在每个环节都选择了架构的简洁性。它避免了Multi-agent系统、复杂RAG(检索增强生成)搜索算法等可能引入的调试和评估复杂性。 只使用一个主循环和扁平的消息历史记录。在处理复杂任务时,它能够通过“克隆”自身来创建sub agent,但最多只有一个分支,这既能实现任务分解,又能确保代理始终关注最终目标,这里的sub agent本质是一个tool 2. 性价比:超过50%的重要LLM调用都使用了更小的模型(如claude-3-5-haiku),用于读取大文件、解析网页、处理Git历史记录和总结长对话。这些小模型比标准模型(如Sonnet 4、GPT-4.1)便宜70-80%,显著降低了成本。 3. LLM原生搜索而非RAG:拒绝了RAG,转而让LLM像人类一样,使用复杂的ripgrep、jq和find命令进行代码库搜索。这更符合LLM理解代码的优势,并减少了RAG带来的新且隐蔽的故障模式。 4. 明确的算法指导:为LLM需要执行的最重要任务编写详细的算法,包含决策点、启发式规则和示例。这有助于LLM结构化决策,避免指令冲突,而不是仅仅罗列一堆“该做”和“不该做”的规则。

00
黄龙教主
7月前

Simon的白日梦: 腾讯开源的为视频生成环境/背景音的模型,效果超级好~comfyui已可用~! HunyuanVideo-Foley: Multimodal Diffusion with Representation Alignment for High-Fidelity Foley Audio Generation 🧐 HunyuanVideo-Foley 是腾讯混元团队提出的 文本-视频到音频(TV2A)生成框架,通过多模态扩散和表征对齐(REPA),在音质、时序同步和跨模态一致性方面显著超越现有方法,实现高保真拟音生成。 ➡️链接:https://szczesnys.github.io/hunyuanvideo-foley/ comfyui插件:https://github.com/if-ai/ComfyUI_HunyuanVideoFoley ✨重点 ● 🎬 研究背景:现有视频生成虽视觉逼真,但缺乏音频严重影响沉浸感;传统 V2A 方法存在数据稀缺、模态不平衡和音频质量不足问题。 ● 📦 数据管道:构建 10 万小时多模态数据集,自动化标注并筛选高质量视频-音频对。 ● 🔗 核心创新: 多模态扩散 Transformer:双流时序融合 + 跨模态语义注入,缓解模态竞争; 表征对齐 (REPA):利用自监督音频特征引导潜在扩散训练,提升稳定性与音质。 ● 🧠 架构设计:融合文本(CLAP)、视觉(SigLIP-2)、音频(DAC-VAE),先经混合 Transformer,再经单模态 Transformer,并通过同步特征调控。 ● 📊 实验结果:在 Kling-Audio-Eval、VGGSound-Test、MovieGen-Audio-Bench 等基准上,全面超越 FoleyCrafter、MMAudio、ThinkSound、Frieren 等 SOTA 方法。 ● 🎧 性能亮点:在音质(MOS)、时序对齐(DeSync)、跨模态一致性(CLAP 分数)上均大幅领先。 ● 🐠 案例展示:如珊瑚礁鱼群游动的水流声、火焰燃烧噼啪声、恐龙脚步与咆哮等,均展现了精确的声画同步。 ● 📚 论文与资源:提供 ArXiv 论文、模型、代码和实验样例,便于社区复现与扩展。

00
黄龙教主
8月前
我发现自己一直以来都有三个问题:
第一个是目光短浅,缺乏复利和长线思维 不相信很多事情是值得投入做的。
第二个是仗着自己有点小聪明,但又不是太聪明,眼高手低,总想走一些捷径。
第三个是太懒。
00
黄龙教主
8月前

Simon的白日梦: 这篇vibe coding的经验文章很值得一看,里边对于很多常见问题有很独到的深入解答,例如:是先计划还是先coding,是小步迭代还是放飞AI,如何避免模型降智等等。 Claude Code: 一个半月高强度 Claude Code :Vibe coding 是一种全新的思维模式 🧐在 Vibe coding 时代,开发者需警惕工具的束缚,真正的高效来源于适应与思考的平衡。 ➡️链接: https://mp.weixin.qq.com/s/fP3kU-O5mbSO8ZS04gowCw ✨重点 ●🚀 迭代速度:Claude Code 在短短一个半月内推出了多项新功能,极大提升了产品迭代速度,令开发者在竞争中感受到前所未有的压力。 ●🧠 思维模式转变:使用 Claude Code 需抛弃传统的 “随时准备接管” 的思维,更应信任 AI,减少干预以实现更高的工作效率。 ●🔄 同步问题:AI 在上下文理解上存在一定滞后,可能导致混乱,开发者需适应这种变化以优化与 AI 的协作。 ●🌐 全局认知:与传统编辑器不同,Claude Code 的命令行工具通过根目录建立对整个项目的认知,更深入理解项目结构。 ●🔍 边界认知:Claude Code 在复杂代码逻辑分析和项目框架搭建方面表现优异,但在需要 100% 准确性的任务中,仍需依赖 IDE 的重构功能。 ●📊 领域偏差:Claude Code 在不同开发领域(如前端和 iOS 开发)表现差异显著,受训练数据的限制,可能出现幻觉和过时 API 的问题。

00