即刻App年轻人的同好社区
下载
App内打开
s7ev3n
131关注107被关注0夸夸
自动驾驶算法研究员 | LLM探索中
ex-momenta, ex-DAMO
s7ev3n
1年前
Saining Xie在智源上做了非常棒的分享,体会比较深的几点:
1.多模态VQA的瓶颈在于CLIP,需要新的、跟不上不同的自监督的范式
2.V*提出了一种使用语言引导的视觉搜索机制,本质上是在构建一个视觉工作记忆+Reasoning机制
3.CLIP是新时代的ImageNet预训练模型,是strongly supervised learning! 而现在视觉的自监督范式卡住了,没有新的进展。
**推荐看视频最后的10分钟**

听Saining Xie感受到了顶尖科学家和科研打工仔的区别...

2024智源大会 谢赛宁 Language Models Need Better Visual Grounding For Meaning And Unders_哔哩哔哩_bilibili

02
s7ev3n
1年前
感谢分享~ 请问下tinyread的图标是使用什么工具设计的呢?

不孤独的二向箔: 最近有几位朋友反馈觉得 tidyread.ai 的设计风格很简约,想让我分享一下 😶‍🌫️ 虽然我是前端开发,但没有设计功底。跟我类似背景的朋友,有几个思路供参考: 1. 根据产品定位,对整体风格进行定调 Tidyread 希望人们能从中建立资讯阅读的秩序感,所以希望以一种简约、安宁的风格呈现。后续相关的设计决策,会紧随调性。 2. 根据产品调性和偏好,选定网站整体配色 最好能同时支持浅色和暗色模式。比如 Tidyread 选择了 norm 作为主要配色风格。 有很多配色方案可供参考: https://shadcn-ui-theme-explorer.vercel.app/ https://nextui-themes.vercel.app/create https://navnote.github.io/rangeen/ 3. 选好底层的 UI 库 我主要使用 https://nextui.org,其次是 https://ui.shadcn.com。部分会用 https://tailwindui.com。 NextUI 的风格会更加现代和有交互感一些。 顺便一提,主力 UI 库的选择,要平衡好设计感和编程效率,最好是能开箱即用,有丰富的 api 和 props 支持。 4. 挑选符合调性的字体 Tidyread 官网使用 Raleway。插件中简报的正文部分,使用 霞鹜文楷。 可在 google fonts 中挑选你中意的字体:https://fonts.google.com。 此外我经常逛 https://www.producthunt.com,遇到眼前一亮的字体我也会记录下来,比如 https://riffo.ai 使用的 AnekKannada 和 Satoshi。 5. 挑选插画,装点网页 我通常会从以下三个网站找插画,尤其是前两个,可以定制主题色: https://undraw.co/search https://popsy.co/illustrations https://www.freepik.com 6. 从其它网站汲取灵感 像 Tidyread 标题中的下划线,就是参考了其它网站,并调整为适合 Tidyread 的调性。 一些可供寻找灵感的导航站: https://saaslandingpage.com https://www.saasui.design https://land-book.com https://landdding.com https://landings.dev

00
s7ev3n
1年前
认真想了下sine这个小工具是:辅助用户渐进式的、研究式的、非线性的(Graph)的展开用户关心的问题,最终形成可分享的、可运行的notebook。不懂UI就简单画了画图,一点点实现起来yay
60
s7ev3n
2年前
哈哈,又可以参加今年的buildspace s5啦,今年主打一个比去年多走一轮,然后分享每次课程的思考~
00
s7ev3n
2年前
看到啦阿苏火山🌋
00:05
20
s7ev3n
2年前
这两天在反思测评系统:
1.在之前的经历中(做实验比较多),测评指标非常重要,它是目标和方向,测评指标的确定和建立要**先**于动手做;论文中的指标在实际应用中和用户体验一般都有不小的gap,但是构建反映实际场景的指标(在自动驾驶领域)很困难
2.NLP领域我是小白,但是在做一些开发的时候,时常会对生成的结果没有定量描述感到不安,因为很多时候可能都是“感觉”,并且也没有类似的tensorborad工具来观察prompt变化后定量的变化。项目简单或在初始阶段,花大力气建立测评可能的确是"Premature Optimization"
3.相关的研究的确有,例如LLM-as-a-judge这种,推上也有一些讨论:x.com
4.万能的即友都是怎么做的呢? 有没有什么推荐的工作或者做法呢?

KleinHE: 分享一篇由宝玉老师翻译的帖子,内容与我和同事、朋友们长期以来的体会非常契合。 《使用大语言模型 (LLMs) 构建产品一年后的经验总结》 其中提到的一个常见误区是将传统软件开发的经验直接应用到 LLM 开发中,过早地建立 Eval 系统。 实践告诉我们,不要过分依赖指标。很多 LLM 相关论文中的评估指标在实践中仅能作为参考。 - 对于可校验的结果,进行单元测试验证; - 对于不可校验的结果,通过人机协作进行评估和改进。 另一个有趣的点是:在格式化数据时,Claude 偏好 XML,而 GPT 更倾向于使用 Markdown 和 JSON。这侧面反映了两家公司在训练时处理结构化数据方式的不同。 感谢@Random_thoughts 哥的分享

00