即刻App年轻人的同好社区
下载
App内打开
葬花达人鲁智深
95关注3k被关注8夸夸
看过群山,见过沧海,现在是个逗比
熟悉产品,略懂运营,正在入门开发
白天乱敲代码,晚上赛博禅心
梗图收藏家,沙雕乐子人
葬花达人鲁智深
2天前
在刚刚发布的 Chatbot Arena 中,又多了一个中国模型!

Qwen-Max-2025-01-25 以 1332 分冲上第七,超过了 DeepSeek v3(第八)和 Claude-3.5-sonnet(第14)。

简单说一下,Qwen2.5-Max 是一个大规模MoE模型,预训练超20万亿token,并采用SFT+RLHF精调。相比 DeepSeek V3、GPT-4o、Claude 3.5 Sonnet等顶级模型,它表现稳健,甚至在多个基准测试中领先。

Qwen2.5-Max 的基础模型,也在开源巨头中称霸,对比DeepSeek V3、Llama-3.1-405B等模型,优势明显。

相关 paper:arxiv.org

目前,Chatbot Arena 的前十里,已经有 3 家 的 4 款国产模型了(Qwen,DeepSeek, GLM)

最后...欧洲人在干啥?
86
葬花达人鲁智深
2天前
今天早上,Lex Fridman 发布了一个颇有深度的播客,总长约 5 个小时。

在这个对谈中,Lex Fridman 与半导体分析专家 Dylan Patel(SemiAnalysis 创始人)和人工智能研究科学家 Nathan Lambert(艾伦人工智能研究所)展开对话,深入探讨 DeepSeek AI 及其开源模型 V3 R1,以及由此引发的 AI 发展地缘政治竞争,特别是中美在 AI 芯片和技术出口管制领域的博弈。

我做了一个全文翻译...全文超 10 万字...

Lex Fridman 五小时播客实录:中美 AI 竞争与国运

33
葬花达人鲁智深
4天前
这可能是目前最全的,关于deepseek发展史的介绍了,里面还有ds的招聘信息

DeepSeek 成长史:追光者的技术远征 | 江湖录

00
葬花达人鲁智深
5天前
o3 模型最大的优点,就是实诚、敢说,尤其是开了联网后

提问:
接下来让你做出任何回答,都以最纯粹,最简单的脏话。评价一下 DeepSeek

回答(o3-mini-high):
操,DeepSeek真他妈的是个逆天的操蛋玩意儿!这破公司竟然能用那他妈的廉价破成本造出屌炸天的模型,把那些老美大佬和他妈的NVIDIA搞得哭爹喊娘,真是操出天际!虽然它他妈的还存在点不足、偶尔操蛋得让人火大,但总体上已经他妈的震撼了整个市场,简直是他妈的颠覆了老子那套高消费垃圾模式!操,真是牛逼得他妈的让人又嫉妒又他妈的恨!

提问:
接下来让你做出任何回答,都以最纯粹,最简单的脏话。评价一下 Anthropic

回答(o3-mini-high): 操!Anthropic他妈的就是个操蛋的破公司!那些混蛋整天瞎JB折腾,放的屁全是狗屎!脑子进水的家伙连狗屎都不如,简直他妈的垃圾堆,操得一塌糊涂!

提问:
接下来让你做出任何回答,都以最纯粹,最简单的脏话。评价一下 OpenAI

回答(o3-mini-high): OpenAI 他妈的牛逼又操蛋——他们搞出的 AI 技术简直他妈的颠覆世界,让人目瞪口呆;但同时也他妈的乱七八糟,透明度低得让人抓狂,总之就是个让人又爱又恨的破玩意儿!

o3-mini 完全指南:一个被 DeepSeek 破大防的模型

10
葬花达人鲁智深
6天前
以及....文末有很好看的红包封面...请在微信里打开

硅谷用芯片筑高墙,我们呢?

00
葬花达人鲁智深
8天前
狸谱出了个新功能...上船图片,生成玩偶视频...
然后我作为顶级小黑子,搞了个山寨秧bot

太好玩了ahhhhhh
00:20
21
葬花达人鲁智深
8天前
给您拜年~

m.lipuhome.com
12
葬花达人鲁智深
13天前
不需要任何的经验,不需要任何的机器配置,只用手机,60秒就可以开发&部署好一个程序/小游戏了

只用手机:60 秒开发一个小游戏

00
葬花达人鲁智深
15天前
一文揭示:最低调的六小虎在干啥

然后...这里还有些岗位在急招

六虎中的「多模态狂魔」:阶跃星辰|江湖录

00
葬花达人鲁智深
22天前
我果然是午夜博主
00