即刻App年轻人的同好社区
下载
App内打开
大模型布道师Roc
492关注705被关注0夸夸
💡关注AI招聘🔍也为大模型公司招人
🌌INTP🪐特工宇宙主理人
📱AI产品经理社群💬vx: ROCAGI
🅙 精神销冠,🎁过6份年度会员
置顶
大模型布道师Roc
1年前
我做的第四个GPTs,黑话翻译机,北美和硅谷的FAANG?国内的BAT字节?留学生?律政圈?医药界?看到什么不懂的黑话直接扔给小黑,它什么都会。by 暂时只会做轻量级GPTs的Roc。
slang.saas.hr
00
大模型布道师Roc
4月前
夸克应该是当下最能打的AI助手了,在25年1月AI产品数据里位列国内第3,全球前20。在信息的搜索生成处理存储之间有种类苹果全家桶的生态。更恐怖的是设计和功能上将主力用户聚焦在大学生和初入职场人群,且第三方数据表明粘性很大。难怪马老师开工后闪现在夸克工位区。潜台词是:来AI toC应聘,明年也能见到他。
02
大模型布道师Roc
6月前
训练成本对比:23年3月GPT4:7840万美元(推测),24年12月DeepSeek V3:558万美元。19个月降低到1//14,新摩尔定律(黄仁勋)仍然有效。
00
大模型布道师Roc
7月前
其实韩信是scaling law最早发现者
《史记·淮阴侯列传》记载
上问曰:“如我能将几何?”
信曰:“陛下不过能将十万。”
上曰:“子有何如?”
曰:“臣多多而益善耳。”
00
大模型布道师Roc
7月前
刚发现钉钉把本来免费的多设备登录也做进365会员了。
00
大模型布道师Roc
8月前
微信的订阅号消息默认折叠到只剩一条了,其他都是看一看,大家怎么看?
22
大模型布道师Roc
9月前
嘀嗒顺风车的运营是我见过最离谱的。
第一次,取消责任判断有异议,app显示可以申诉,秒被驳回。再次联系客服,客服说那个按钮是机器人复审,而且复审不改变就没法改变结果。(那你设置那个按钮的目的就是增加冤假错案?)
第二次,偶尔长途接一单,无违规无爽约。回去后提示信用分倒扣40。客服理由是你没有每日登录app。我tm你一个顺路接单平台是发黄金了么,我要每天登录你?
01
大模型布道师Roc
10月前
大模型浏览器插件的兼容性食物链,你知道是什么吗?🐶
21
大模型布道师Roc
10月前
大模型浏览器三家(秘塔豆包和Monica)插件不兼容问题,情况更新:
1,豆包现在和秘塔兼容了。
2,monica依然和秘塔不兼容(秘塔开着,monica悬浮框功能不输出回答)
3,秘塔关闭时,豆包和monica不兼容加剧:
选取文字少的时候,豆包几乎100%遮掉monica;不知不觉帮用户”卸载“了Monica。
选取文字多的时候,monica还能露出个头。
00:30
12
大模型布道师Roc
10月前
我让13家大模型代替计算器,差点全军覆没?
故事是这样的,有朋友和我打赌唐尚珺历年高考总分有没有到1万分。他高考了16次,我们不想一次次用计算器按了。于是想用大模型代劳。
结果用的第一家就告诉我唐尚珺历年高考总分之和3万多分。这不禁让我想到9.9和9.10谁更大,这个经典AI数学难题。

显然,大模型能否胜任累计求和的简单问题的测试,比之前的赌约有趣多了。于是我们就换成了是否有大模型和国产大模型能稳定胜任此任务。
我们的测试对象有:GPT4o,字节豆包,阿里通义Max,文心一言4.0Turbo,腾讯元宝,月之暗面Kimichat,智谱清言,阶跃星辰跃问,MiniMax海螺,百川百小应,零一万物万知,DeepSeek Chat,昆仑天工,十三家。

直接宣布结果吧,GPT4o不出意外能稳定回答正确。
同样能稳定正确的国产还有三家。测试多次回答正确过的有一家。回答越来越离谱,最后干脆死机的有一家。
正式结果小结放评论区

图1,大厂&上市公司的模型,文心一言,豆包,天工,千问。
图2,创业公司结果1,deepseek,跃问,kimi(成功失败都有)
图3,创业公司结果2,万知,百小应
图4,稳定成功案例。OPENAI,腾讯元宝,海螺,智谱清言
42