即刻App年轻人的同好社区
下载
App内打开
Pageni
49关注3被关注0夸夸
INTJ / 翻译 / AI Native Baby Coder
做一名真诚有温度的创作者
Pageni
17天前
一个迷思:
同样的提示词
模型官方网页版 与 智能体 使用效果相差不大
但如果是自己写代码调用模型API 则显著降智
按理说智能体也是填写的API调用
问题出在哪呢?

#提示词工程
20
Pageni
1月前

云中江树: 看了吴恩达老师的翻译智能体开源代码 因为最近打算做一次 AI 工作流方面的分享,所以查找了相关的资料和应用,花了一个早上阅读了吴恩达老师开源的翻译智能体的核心代码,获益匪浅。 这个小项目的核心代码就几百行,代码思路非常清晰。其中体现的 AI 智能体概念,AI工作流设计等概念虽然并不新奇,但是整体实现度和完成度很高,不失为一个 llm 应用开发者入门学习的好项目。 这个智能体核心做的是翻译任务,使用大模型后可以将任意内容的从源语言翻译为目标语言。(如英文到中文) 这是一个很产品化的工作流: 1. 首先判断文本长度,看大模型能不能一次处理完。 2. 翻译短文本,则直接走反思工作流: (1) 第一次翻译。依据源语言,目标语言(等更多信息),待翻译内容构建提示词,然后给大模型翻译。 (2) 反思: 把翻译结果等信息给到反思智能体,有针对性的根据 AI 翻译常犯的错误进行反思评价,给出改进意见。 (3)二次翻译。把源语言,目标语言,待翻译内容,第一次翻译内容,反思评价内容等等都用来构建提示词,再次翻译,对第一次翻译内容进行改进提高。 3. 如果是长文本,一次翻译不完则会拆分多段翻译。为了保持翻译结果和上下文的连贯性和流畅度,翻译的时候会把当前段落和之前一段与之后一段(共三段)一起拿过去翻译。然后和短文本一样走反思评价工作流。 我也管上面的叫二次翻译工作流,和宝玉老师提出的思路类似。顺带想到了之前刚哥@李继刚 分享的信达雅翻译,三次翻译的工作流,也是可以用类似方法做的更精细稳定的。 总的来说,吴恩达老师这个翻译智能体里面没有涉及太多新的概念,也不复杂,几乎是最简单的工作流了,不过细节处理的很精细,延续了吴老师一贯以来的严谨细致的学术范儿。 如果是在做llm的落地应用,相信会比较有启发。 项目地址:

00
Pageni
1月前
有趣

张楚琪-沉迷AI版: Self-Refine:通过针对性地反馈 (Feedback) 调整循环来引导 AI 输出更好的答案。 上周吴恩达教授在 The Batch 中聊到了智能体 (AI Agent) 工作流设计模式中的反思模式 (https://m.okjike.com/originalPosts/6607dc65a922aa28d05cbbc7?s=ewoidSI6ICI2NGI3NDBlNWI4Yzc1YTFiYjhkNDA0YjciCn0=),并推荐了三篇论文: - Self-Refine (https://arxiv.org/abs/2303.17651) - Reflexion (https://arxiv.org/abs/2303.11366) - CRITIC (https://arxiv.org/abs/2305.11738) 读下来对我启发最大的是 Self-Refine,也是我认为能够在日常与 AI 对话中可以直接用得上的。如果你的工作会涉及到智能体 (AI Agent) 的工作流,Reflexion 和 CRITIC 可以参考一下,对于日常使用 AI 来说,不读问题也不大。模式都比较好理解,难的是工程上如何针对性地应用。 其中,Reflexion 的模式是有三个主要的角色加一个记忆模块 (Memory) 来实现: 1. 执行者(Actor):就像一个尝试解决问题的人,它会根据当前的情况提出行动计划,并执行这些计划; 2. 评估者(Evaluator):类似于一个老师或评委,它会评估执行者的行动计划是否有效,并给出成绩或反馈; 3. 反思者(Self-reflection):当执行者的计划不够好时,反思者会帮助它理解哪里出了问题,并提出如何改进的建议。 就像人类在犯错后会思考如何改进一样,这个过程中,Actor 会尝试不同的行动,并从结果中学习。每当 Actor 完成一个步骤时,Evaluator 会评估 Actor 的表现,并记录下哪些做得好,哪些需要改进。这些记录被保存起来放到 Memory 模块中,以便在未来的尝试中让 Actor 参考,并在未来做出更好的决策。通过这样的尝试、评估和反思循环来更好地完成指定的任务。 整个过程参考图一。 CRITIC 则更好理解,就是借助外部工具来给 AI 提供更精确的反馈,然后让 AI 根据这些反馈来优化输出。过程大致如下: AI 输出答案以后,借助适当的外部工具(如搜索引擎、代码解释器等)来验证答案中的某些环节,比如可以通过搜索引擎或者文档资料来验证事实性信息,或者通过代码解释器来执行 AI 生成的代码是否能够正常运行等。同时将验证后的结果形成反馈信息再发送给 AI,让其根据反馈来修正输出。重复这个验证和修正的循环,直到满足特定的停止条件。 整个过程参考图二。 Self-Refine 方法则更容易理解,其核心是两个相互交替的步骤:Feedback(反馈)和 Refine(优化)。就是让 AI 自己对自己的答案进行评估并给出针对性的反馈,这些反馈不仅指出了问题所在,还提供了改进的方向。 然后引导 AI 根据这些 Feedback(反馈)来调整输出,也就是 Refine 步骤。这一过程可以重复多次,直到输出达到满意的质量标准。 整个过程参考图三。 即使这个过程不自动化,对于我们日常使用来说,也有很大价值。当 AI 的输出不符合我们的预期的时候,除了考虑要拆分子任务之外,另外很重要的一点就是指出 AI 的回复中具体的问题,告诉它哪里哪里不好,为什么不好,应该如何等。这就是我们在主动提供 Feedback(反馈)。 Self-Refine 的方式是让 AI 自己给自己 Feedback(反馈),其对我最大的启发是:要针对具体任务设计 Feedback 原则。 论文中针对对话设计的 Feedback 原则是从 Relevant(相关性)、Informative(信息量)、Engaging(吸引人的)等方面来引导 AI 给出反馈;而针对代码生成任务则是从效率(Efficiency)、可读性(Readability)、准确性(Accuracy)等方面来生成反馈。 这种思路是不是可以借鉴到我们用 AI 完成其他日常任务呢? 举个例子,当我们觉得 AI 英译中的结果不够好时,简单的方式可以是让其用某种文章内容相关的角色来进行润色,或者让其自己反思翻译结果有什么问题再重新翻译。 那如果按照 Self-Refine 中的 Feedback 原则,在让 AI 反思的时候,指出具体的反思方向会不会更好呢?比如可以从准确性(Accuracy)、流畅性(Fluency)、语法正确性(Grammar Correctness)、词汇恰当性(Lexical Appropriateness)、文化适应性(Cultural Adaptation)、风格一致性(Style Consistency)、目标受众(Target Audience Suitability)等方面来对翻译结果给出反馈,这样是不是能得到更好的结果呢? 当然,Self-Refine 要能够有效,首先 AI 本身的能力要足够强,否则 AI 得不出有价值的反馈。另外要注意的就是论文的测试结果都是基于英文的数据集。不过没关系,试试这种思路没什么损失,我相信起码不会得到更差的结果。 我会在接下来翻译 The Batch 的时候尝试一下这个方式。

00
Pageni
10月前

alon: 非程序员,目前用的AI 编程工作流 需求分析/技术方案阶段: 1、gpt需求分析: 首先发散(7个维度):和gpt充分沟通7个维度:用户,场景,当前痛点,当前方案,频度,广度,深度,然后生成尽可能多的功能点需求 其次收敛(33原则):按照每次开发最多只做3个核心需求,每个功能最多只做3个功能点 2、gpt生成文档:prd.md / erd.md / todolist.md(供 Cursor 用) 产品需求文档 prd.md 工程结构和数据结构设计文档 erd.md 开发代办列表 todolist.md 正式开发阶段: 3、Cursor 执行开发任务 1,严格按 todolist.md 开始, 每完成一个任务后同时更新todolist.md 和cursorlog.md 4、Cursor开发过程中,第一次要输入详细prompt,后续可以简化,每个任务开发完成后做2件事情 a,观察todolist和cursorlog是否正常更新,没有就是跑偏了,立刻回滚,然后输入详细prompt重新生成。 b,如果todolist和cursorlog正常更新,则做一下测试,验证当前完成的开发是否符合产品预期,如果符合就继续开发下一个任务,否则就回去改bug。 直到全部完成 5、全部完成后,需要的话,可以把代码打包丢给gpt,让它做code review,再看要不要继续优化下 6、全部跑通后 输出 Changelog + Git 封版 今天回归第一天,看到前面有评论提到这个,正好说下我目前用的办法 还在持续迭代中,如果有更好的方式,求大佬不吝指点

00
Pageni
10月前

歸藏: 整个大活,我用 AI 写了个工具 帮大家更低成本、更可控的用 AI 生成漂亮的网页! 优雅的解决上个版本提示词不可控和有时候没那么漂亮的问题 👇下面是使用方式和我的开发过程 你可以在我这个网页工具上自定义各种基础的样式,或者你可以直接点击随机生成,直到随机到你喜欢的。 不用担心每次随机都很丑,我做了很多的视觉约束,会保证每次生成的基本美学表现。 可以来试试:https://60mcp23013.yourware.so 先介绍一下怎么使用 整个页面的核心就是两个部分一个是调整样式,一个是导出样式和提示词。 首先你可以在页面左侧对网页样式进行调整,比如主题色、辅助色、字体、大小、字间距、按钮样式等。 然后可以在右侧预览,预览这里我也做的很细,做了三个页面首页、产品、博客,方便你在不同的页面内容上预览。 另外预览的部分还支持手机、电脑、平板不同页面宽度的预览,另外咱们的夜间模式也是有的。 我知道你们看着左边密密麻麻的元素头疼,所以还给大家两个兜底 首先你可以选择预设的各种风格模板,另外的话可以点击「随机生成」按钮,点完所有的元素都会变化,多点几次选你们喜欢的就好了。 最后就是导出和如何使用了。 点击导出样式之后,你可以在左侧的 Tab 抽屉看到提示词和对应的代码,觉得看不懂是吧,没问题,我已经考虑到了,你只需要复制提示词、点击下载文件。 之后将你自己的内容文档、提示词和下载下来的 Json 文件一起扔给 Claude 回车就行,其他一概不用管。 当然还有提示词 虽然网页上面可以复制提示词,但这里还是写一下,方便大家收藏,其中 json 部分需要在网页生成。 我会给你一个文件,分析内容,并将其转化为美观漂亮的中文可视化网页: ## 内容要求 - 所有页面内容必须为简体中文 - 保持原文件的核心信息,但以更易读、可视化的方式呈现 - 在页面底部添加作者信息区域,包含: - 作者姓名: [] - 社交媒体链接: 至少包含Twitter/X: - 版权信息和年份 ## 设计风格 - 整体风格参考Linear App的简约现代设计 - 使用清晰的视觉层次结构,突出重要内容 - 配色方案应专业、和谐,适合长时间阅读 ## 技术规范 - 使用HTML5、TailwindCSS 3.0+(通过CDN引入)和必要的JavaScript - **使用CDN引入Preline UI组件库,按需使用其组件增强界面效果** - **根据提供的JSON文件内容(颜色、字体等)配置TailwindCSS的样式Token,确保设计一致性** - 实现完整的深色/浅色模式切换功能,默认跟随系统设置 - 代码结构清晰,包含适当注释,便于理解和维护 ## 响应式设计 - 页面必须在所有设备上(手机、平板、桌面)完美展示 - 针对不同屏幕尺寸优化布局和字体大小 - 确保移动端有良好的触控体验 ## 媒体资源 - 使用文档中的Markdown图片链接(如果有的话) - 使用文档中的视频嵌入代码(如果有的话) ## 图标与视觉元素 - 使用专业图标库如Font Awesome或Material Icons(通过CDN引入) - 根据内容主题选择合适的插图或图表展示数据 - 避免使用emoji作为主要图标 ## 交互体验 - 添加适当的微交互效果提升用户体验: - 按钮悬停时有轻微放大和颜色变化 - 卡片元素悬停时有精致的阴影和边框效果 - 页面滚动时有平滑过渡效果 - 内容区块加载时有优雅的淡入动画 ## 性能优化 - 确保页面加载速度快,避免不必要的大型资源 - 图片使用现代格式(WebP)并进行适当压缩 - 实现懒加载技术用于长页面内容 ## 输出要求 - 提供完整可运行的单一HTML文件,包含所有必要的CSS和JavaScript - 确保代码符合W3C标准,无错误警告 - 页面在不同浏览器中保持一致的外观和功能 请根据上传文件的内容类型(文档、数据、图片等),创建最适合展示该内容的可视化网页。在配置TailwindCSS时,请使用提供的JSON文件中的颜色、字体等配置项来自定义样式Token。 再来看我是怎么做的 我之前当设计师的时候做了很长时间的设计系统,所以对设计工程化和如何保证还原度还是有一定的研究。 因为这套提示词是基于 TailwindCSS 的,刚好他就设定了非常多已经整合好的 CSS 样式,我们只需要在更改一部分它默认的样式的值就可以让我们的页面发生很大变化。 但是 TailwindCSS 的值还是太细了,不太好调整,那有没有更加整合的东西呢,有的,组件库或者说设计系统。 市面上有非常多基于 TailwindCSS 构建的设计系统,他们在CSS 样式上再次封装,重新设计了每个前端组件。 比如:按钮、输入框,还有他们的各种状态选中是什么样的、禁用是什么样的。 所以我还引用了基于 TailwindCSS 的组件库 Preline UI。这样一来我们的基本美学表现就有了很大的保障,因为一些规则已经约束好了。 生成整个产品的过程很简单也让我对 Claude 3.7 的强大有了新的认知,我整理完需求发给他,他一次就搞定了这个接近 4000 行代码的工具。 当然还是有些小 BUG,我用 Windsurf 修复了一下,补充了一下缺失的元素,然后用 Youware 上线了,就这么简单。 涩话时间 当我坐在电脑前,看着这个从构思到实现的工具终于完成时,我有些迷茫。 我既害怕又兴奋,害怕的是我之前学的那么多东西突然很多都没意义了,兴奋是这玩意会带来非常多的机会。 这种复杂的情绪,恐怕是我们这个时代每个创作者都会经历的。 当我看着Claude在短短几个小时内就完成了需要我数周甚至更长时间才能实现的代码,我不得不直面这个问题:技术的进步到底是在取代我们,还是在赋能我们? 技术的本质从未改变,它始终是人类思想的延伸和工具。 真正有价值的,不是我们掌握了多少技术细节,而是我们对问题的洞察、对用户的理解、对美的鉴赏,以及将这些转化为实际解决方案的能力。 技术可以简化过程,但永远无法替代我们独特的视角和表达。

00
Pageni
10月前
好的产品不一定有多先进的技术
但一定是好的点子
和优秀的细节处理
10
Pageni
10月前
最近的感悟:
AI Solution
or
Coder Solution
That is a question~
00
Pageni
1年前
Term_g
1. 术语抽取
(1)对文本进行句对处理
(2)用大模型对句对进行术语抽取
* 需要对术语进行定义
* 后期可将此功能嫁接到CAT
2. 译前匹配
(1)对文本进行AB段落对照处理
(2)脚本:上传术语表AB列,将A列术语至A段逐一查询,完全匹配则在CD列返回AB列术语
?:表格or文档
3. 译后一致性
(1)对文本进行AB段落对照处理
(2)脚本:上传术语表AB列,将A列术语至A段逐一查询,完全匹配则在B段查询是否有B列术语,返回TRUE or FALSE AB列术语
* 术语表需确保A列无重复

3.13 2已实现 表格
00
Pageni
1年前
记录下CAT的开发
1. 机器翻译彻底放弃。AI翻译功能保留,外译中需要,中译外不需要。
2. 翻译需要的是确定的参考,而非模糊的参考。确定的参考指的是以往的语料或者客户给的参考文件。
3. 翻译时,跑一遍语料库,可以把75%相似度的语料匹配出来。
或者呈现方式为:原文有颜色下划线提示。点击,浮窗显示语料对。可操作一键带入译文,或可部分复制粘贴。
4. DS可用于对原文的改写、信息检索、译文的润色(大概率是做成浮窗)
5. 提交前的Q&A质检,AI spell check
6. 术语:同语料库。可预跑术语库,把100%术语匹配,原文颜色显示。
部分选中原文本,手动进行术语查询。
7. 翻译过程可即时术语入库,并再应用于译文。
00