即刻App年轻人的同好社区
下载
App内打开
OrangeCLK
564关注6k被关注13夸夸
互联网话题优秀贡献者
www.orangeclk.com
不用「您」字
不用「她」字
置顶
OrangeCLK
2月前
大型语言模型(LLM)在不同任务上展现的能力存在差异。我觉得在写代码和写文章这两个任务中,LLM还是更擅长写代码。

语言模型物理学目前将语言模型的能力划分为三个主要方面:知识、推理和形式。

编程语言包含许多具有明确格式和规则的元素。例如,变量如何声明、函数如何定义、代码块的起始/结束标记、循环和条件语句的语法等,都有相对固定的写法。常用的设计模式也都有经过验证的代码结构供LLM学习参考。LLM擅长生成这些符合规范的代码组件,自动化完成许多需要遵循格式的编码工作,从而提高开发效率。

写作通常避免套话和冗余表述,LLM生成的文本有时显得模式化,包含空洞的填充语句。要得到精炼的文章,用户需要投入精力修改,这使得LLM直接产出所需内容时效率并不像写代码那么高。

写代码的时候有很多格式文本不得不写,使用LLM辅助可以省掉这些填充格式的工作——此前往往由IDE自动补全、模板等功能来实现,但现在LLM能做得更好;而写作则需要超越固定表达,追求内容精炼与创新,这与LLM的输出方式不同,常需要人工干预。

我最初认为,可能存在一种认知偏差:即某个领域的专家更容易发现AI在自己专业领域的不足,因为他们熟悉领域中的细微差别和高标准。因此,他们可能会推断AI在自己不熟悉的领域表现得更好。写作者可能觉得LLM不擅长写作擅长写代码;反之,计算机专家也可能觉得LLM不擅长写代码擅长写作。

这个观点的核心是,专家容易低估AI在自身领域的表现,而高估其在其他领域的表现,因为他们对其他领域的评判标准可能不那么严苛。

现在,我仍然坚持这个观点,其实这个观点就是在说LLM处在专家以下新手以上的水平。但除此之外,我认为LLM在代码方面的确展现出更强的能力,这种更强不仅仅是上述跨领域观察偏差的结果。代码本身的性质——对严格的格式、明确的规则(如变量声明、函数定义、语法结构)和既定模式的依赖——恰好与LLM处理形式、规则的能力非常契合。相比之下,高质量的写作往往要求更高的原创性、语境理解和避免模式化表达的微妙技巧,这对当前的LLM来说挑战更大。

类似,如果是写作中格式要求比较多的文书工作——比如结构明确、要写很多固定内容的文件、材料,我想LLM也格外胜任。

本作品采用知识共享署名-相同方式共享 4.0 国际许可协议进行许可。

原文地址:www.orangeclk.com
20
OrangeCLK
1天前
10
OrangeCLK
2天前
刷到小红书片段,王虹在清华的讲座居然是中文的,不可思议。
又搜了一下,有一个从中文切换到英文的过程。
20
OrangeCLK
2天前
除了前几天推荐过的关于目前垃圾分类与焚烧现状的文章,还有这篇 2020 年讲述北京垃圾分类启动的报道,讲述了垃圾分类的目标、困难、产业、焚烧和填埋的关系等等。
00
OrangeCLK
4天前
> 产能过剩的背后有多重原因,其中一点是垃圾分类后入炉量减少。

> 严格的管理条例出台后,徐伟明显感到送到后端的生活垃圾量大幅减少。“当时,北京市要求把厨余垃圾从生活垃圾里分出来,(送到焚烧端的)量就少了20%左右;随着垃圾分类制度的进一步执行,可回收的那部分其实也是分出来的;政策还要求生活垃圾从源头减量,所以最终生活垃圾焚烧量从2020年开始陆续减少,最终减少比例达35%左右,从最初的520吨到最后只有300多吨。”
31
OrangeCLK
7天前
30
OrangeCLK
7天前
00
OrangeCLK
8天前
派蒙科普,这个账号在抖音上也有,和 B 站发的不一样。抖音上有意思的数学账号不少。

韦东奕不止是竞赛天才,更是优秀数学工作者_哔哩哔哩_bilibili

00
OrangeCLK
8天前
大概七八年前,我是 pocket 用户。但是后来就不敢用免费网络软件了,有一天特地把 pocket 数据全都备份,再后来就只用付费网络软件和本地软件。对我来说目前就是 cubox obsidian。我觉得笔记软件的可持续性挺重要,不然像 pocket 这样停服了就很难受。如果有个笔记软件让人大量免费用 DeepSeek R1 整理笔记,我是肯定不敢用的。
40