即刻App年轻人的同好社区
下载
App内打开
陈言_Linkc
137关注1k被关注0夸夸
🔮 致力于创新团队工作流程 AI化
💡 跨周期产品设计师
🎲 社区、媒体科技、生态治理专精
🏄 效率工具爱好者,玩票自媒体
陈言_Linkc
15天前
每年六月,高考放榜的紧张,迅速被志愿填报所取代。对于千万家庭而言,这将是一场更加艰难的考验。面对数千所高校、上千个专业,信息不对称、决策成本高、对未来就业的迷茫……我现在想想还心有余悸。

AI时代,有没有一种方式,能让顶尖的志愿填报服务不再是少数人的特权?

夸克的高考志愿大模型,正是为了回答这个问题而生。它并非一个简单的信息检索工具,而是一个融合了海量权威数据、前沿AI技术与数百名资深专家智慧的“决策辅助大脑”。

夸克做的第一件事,就是构建一个堪称“活字典”的知识库。

与依赖网络公开爬取的工具不同,高考志愿大模型背后,是一个专门为“报考场景”打造的、国内目前规模最大的高考知识库。

它系统性地整合了全国2900多所高校、近1600个本科专业的招生章程、课程设置,以及上千所高校的毕业生去向,以及产业趋势。这些信息源自各省考试院发布的官方资料,并通过多重技术手段确保准确。

而一个人类专家之所以专业,不在于他能背下所有学校的分数线,而在于他能根据一个学生的具体情况——成绩、兴趣、性格、家庭背景——构建一条清晰的决策逻辑链。

高考志愿大模型要做的,就是让AI“拜师学艺”,学习顶尖专家的这种思考模式。为此,夸克邀请了数百名拥有超过十年经验的资深高考志愿规划师,记录并分析了他们与考生的上万次真实对话。

专家们如何引导一个内向的考生在不同职业间抉择?如何权衡家庭的期望与个人的理想?这些真实的“推理链”被转化为高质量的训练数据,让AI去深度学习。

通过这种方式,AI不仅学会了专家的套路,更重要的是,它学会了专家的思路——在复杂、模糊、甚至矛盾的条件下进行分析、推理和判断的完整思维过程。

为了让AI的能力不断精进,夸克还引入了一套“模拟考场”和“专家评审团”机制。

AI会基于一个虚拟的考生档案,生成一份完整的志愿报告。这份报告会被多位人类专家“盲审”,从多个维度进行打分和点评,每一次“挑刺”,都会变成一个明确的信号反馈给AI,进行学习。

通过数千份志愿报告的“人类挑刺 + 模型修正”闭环,AI的能力得以持续进化。它学会了“反思”,能力进一步泛化,能处理各种千奇百怪的个性化需求,严谨性和全面性也因此大幅提升。

高考志愿大模型的背后,是夸克多年来在数据、技术上的积累,更是数百位志愿专家将宝贵的经验与智慧,毫无保留地传授给AI的结果。他们将帮助每一位站在人生十字路口的考生,做出更明智、更无悔的选择。
03
陈言_Linkc
24天前
飞猪的AI问一问,可能是最近toC垂直领域最深入的Agent探索了。解决相对收敛的垂直问题,深度绑定行业工具,又能基于用户数据给出合理的引导。

其中把一个个tools定位为“航班管家”、“旅行计划管家”还挺妙的,把子任务外显出来,让用户看到AI思考和生成的过程,可以平复C端用户对速度的焦虑。

更新总在放假前?飞猪AI问一问新功能实测 - 小红书

01
陈言_Linkc
1月前
很棒的创意
00:53
21
陈言_Linkc
1月前
用Lovart生成了一组AI大佬的塔罗牌,文案还有待优化,但形象、风格、视觉元素拿捏得相当到位。

设计Agent就两点最重要:对于设计需求和审美要求的理解,以及帮助大模型掌握设计方法和工具使用。前者考验团队对行业的理解,后者是技术上的护城河。
00
陈言_Linkc
2月前
把自动喂食机的数据截图发给AI,让它根据log分析宠物进食习惯,并制定计划。ChatGPT 04-mini和Gemini 2.5 Pro结论一致。Qwen-2.5-Max给🐱扣了一份口粮,Claude-3.7-Sonnet给它加了一份。最大的感触(它们是真的在算啊,那个推理过程,好像四个账房先生在那打算盘、掐手指头)

prompt:
图片是宠物喂食机每天出粮,以及宠物进食情况。自动喂食器可以在每天8点、12点和18点分三次自动投放食物。(每份固定约10g)请根据宠物的进食习惯,设定每个投喂时间点应该投喂的份数。目标是在满足宠物进食要求的前提下,不要过多剩余食物。
00
陈言_Linkc
2月前
好玩…不过OpenAI的版权限制真的很迷。
00
陈言_Linkc
2月前
AI的妙用,深度搜索功能还是很方便的,确实是挖掘出很多我理解不到的观点。
20
陈言_Linkc
2月前
OpenAI 发布了最新的模型系列:GPT-4.1、GPT-4.1 mini GPT-4.1 nano。这三款模型目前仅通过API提供,旨在为开发者带来更强大的能力和更优的成本效益。

核心亮点:
1️⃣性能超越前代: 新模型系列在各项基准测试中普遍超越了 GPT-4o GPT-4o mini,尤其在 编码 指令遵循 方面取得了显著进步。
2️⃣编码能力大幅提升: GPT-4.1 SWE-bench Verified 上的得分高达 54.6%,比 GPT-4o 提升了 21.4%,成为领先的编码模型。它在处理代码 diff、遵循格式、减少冗余编辑等方面也更可靠。
3️⃣指令遵循更精准: Scale MultiChallenge 基准测试中,GPT-4.1 得分提高了 10.5%,能更可靠地理解和执行复杂、多步骤或带有约束条件的指令。
4️⃣更强的长上下文处理: 所有三款新模型均支持高达 100万 token 的上下文窗口,远超之前的 128k token。同时,它们对长上下文的理解和信息提取能力也得到了优化(如“大海捞针”测试和新的 OpenAI-MRCR、Graphwalks 评估所示),能更好地处理大型代码库、长文档分析等任务。

优化的成本与效率:
1️⃣GPT-4.1 mini: 小型模型性能的巨大飞跃,在许多基准上甚至超越了 GPT-4o,但延迟近乎减半,成本降低了 83%。
2️⃣GPT-4.1 nano: OpenAI 迄今为止 最快、最便宜 的模型,拥有 100万 token 上下文窗口,性能超越 GPT-4o mini,非常适合需要低延迟的任务(如分类、自动补全)。
整体成本下降: GPT-4.1 GPT-4o 的中位数查询成本降低了 26%。同时,对于重复传递相同上下文的查询,提示缓存(prompt caching)折扣提高到 75%。
3️⃣视觉能力增强: 新模型系列,特别是 GPT-4.1 mini,在图像理解方面表现优异,在 MMMU、MathVista 等多个视觉基准测试中得分亮眼,并能在无字幕的长视频理解(Video-MME)任务中取得领先。
4️⃣更适用于构建智能体(Agents): 改进的指令遵循可靠性和长上下文理解能力,使 GPT-4.1 系列模型在驱动能够自主完成任务的 AI 智能体方面更为有效。
(知识更新: 知识库更新至 2024年6月。)

GPT-4.5 Preview 将被弃用: 由于 GPT-4.1 在性能和成本上更具优势,GPT-4.5 Preview 将在 2025年7月14日 停用,开发者有三个月时间进行迁移。

总而言之,GPT-4.1 系列是 OpenAI 聚焦于开发者实际需求,在编码、指令遵循、长上下文处理和成本效益方面迈出的重要一步,为构建更智能、更可靠、更强大的 AI 应用和智能体解锁了新的可能性。欢迎开发者们通过 API 探索和使用这些新模型!
03
陈言_Linkc
3月前
又是用GPT-4o整活儿的一天。
21
陈言_Linkc
3月前
这个GPT-4o的玩法挺火,我是在@歸藏(guizang.ai) 看到的,自己优化了一下提示词。
这里有一点建议:
- 先尝试AI能不能理解想要画的内容,如果可以,就不要添加不必要的提示;
- 如果AI不能理解或者有版权限制,就先增加文字描述,比如演员的名字、场景、物品;
- 如果形象生成的有问题,再增加演员的照片。(比如梁朝伟、黄秋生AI就知道长什么样,林家栋就差点)

下面的提示词是我用来画陈佩斯的。
------------------
创建一个全身人物手办玩具,玩具的形象参考我上传的照片。让它成为一个动作人偶(action figure blister pack)。
在人偶旁边,是他的装备:(与玩具人偶一起放到包装里)
- 毛瑟C96手枪
- Gray Fur Felt Fedora Hat
- 白色毛巾
此外,在包装上的文案,主题是"白日做梦!",副标题是"陈佩斯"。
你设计的包装应该具有抗日战争相关的元素。以一种真实的方式来可视化这个场景。
输出图片比例2:3。
------------------
01