即刻App年轻人的同好社区
下载
App内打开
Nothing_8
75关注233被关注1夸夸
Nothing_8
26天前
今日vibe笑话

​用户:请你处理一下,返回一个dict

​cc怎么做呢:
​1.返回了一个list(啊?)
​2.去检测这个list的类型是否为dict(啊??)
​3.如果不是dict,则视为异常,fallback处理成一个空dict(啊???)
​4.封装成一个特定配置文件
​5.继续封装成一个configLoader
​6.继续封装成一个dataLoader
​7.去接入一个新的dataLoader,当然不出意外的,也会有新的configLoader
8.​这其中,每一环都会有一个奇怪的class和一个奇怪的fallback

​每一次debug就像断案一样抽丝剥茧,每一个函数都感觉像被cc包装成犯罪嫌疑人,每一次翻代码都不得不让我感叹,“藏的真好,怪不得我找不到”

如果A社的PKI靠token用量评估,那个优化prompt的哥们一定会捧起属于自己的奖杯吧。

一个月前的LLM:难道vibe coding真的是未来吗?!
也现在的LLM:
- gpt5-codex:养生,五个项目开着还能让用户去坑边钓会鱼
- gemini:我碎嘴子是为了overloaded
- claude:你说的对,但我的降智是善意的
- glm:我的限速也是善意的,但一码归一码,事我只办这点,有别的事后面再说

现在的主流非开源模型的相互掣肘,在不可避免的降智过程后显得如此平等,都变成了高考后的朦胧少年。
朦胧少年青涩纯真有活力我理解,但能不能不要收我那么多的token费用啊喂!

最近的感触总结:
​垃圾代码防破解,论文代码防复现;
混淆代码防解决,vibe代码防上线。

00
Nothing_8
1年前
国庆用Power Automate干活,简单说一下踩过的坑。

## 循环任务下最好找不重复的标识符
使用Power Automate处理循环任务时,最好找一个无重复的标识符。因为Power Automate的循环任务做不了”let item of items”这种情况,无论是对items做操作,还是想办法提取出item,都会有很多奇奇怪怪的问题。
官方给的解决方案是如果有重复元素,可以使用order变量来进行索引。而这就会有另一个问题,order是全局索引,如果我选择特定的iframe特定的表格,里面超链接的order不会是1,而是26(其他页面的25个超链接加上这个1个超链接)。这就意味着如果我这个循环外面再套一层任务的话,那么每次执行任务我都需要调整初始索引以正确遍历到目标超链接。
那么初始索引在哪里呢?这就是新的问题,每次初始索引的获取我都需要去进行手动操作,就很费劲。
除此之外获取索引的方式也有问题,目前我已知的方式有”从网页中提取数据”和”添加UI元素”两种方式,前者倾向于类选择器定位,后者倾向于id选择器定位。前者的有效性只存在调试页面,刷新一下就失效了,所以我一直在使用后者的方式。
不过这就又有了新的问题,Power Automate会经常出现定位偏移的情况,你捕获的order是26,但实际的order是3,所以我还需要进行多次测试以定位到正确位置。

## FluentUI是一款开放世界UI,后面卡了
得益于微软最新流行的FluentUI设计,Power Automate特别特别特别卡。调试的网页经常掉用户session,我这边本想开虚拟机调试(6C6G),没想到调试过程中Power Automate频繁卡死,每一次点击都会让你产生”kale”的喜悦。

## 网页自动化问题
如果有两行超链接的话,Power Automate不会点上行文字也不会点下行文字,它会点正中间,这就导致点击无法触发(拳头硬了)。目前的解法只能是强行缩小比例来减少文字行数,或者是使用油猴脚本改一下超链接文本的overflow。

## 疑似缓存问题
如果多次运行会出现浏览器和Power Automate双卡死的情况,感觉像是奇怪的缓存问题,需要定时重启Power Automate和刷新浏览器。

## 其他小问题
1. JS调用函数间歇性失灵,当次运行ok下一次就完了。
2. 插入变量时最好使用文本编辑器模式,低代码传入变量的话有时会自动变空。

Power Automate感觉目前只适合做辅助工具,它在全自动化设计中问题还是非常多,不建议作为RPA的可靠选择。
这次就不该在DDL较劲的情况下完全依赖大公司的低代码平台。后期还是需要调研支持Python的RPA。

10月7号晚上10点,nothing突然说”完事喽!”,然后愉快的开学了。(欣慰沉睡.jpg)
00
Nothing_8
1年前
数学总是会在出其不意的地方给你个大嘴巴子。告诉你无论在什么时候都不要得意忘形。

计算似严父,图像如慈母。
计算会在你做出"1+2=7"的壮举后告诉你完全失败,重新再来。图像总会露出温和而又美丽的笑容,让你只可远观不可亵渎。
(为什么说亵渎,就不得不提等差数列应用案例---炉石传说了)

想起研二的时做数学元宇宙项目时,看到"数学之美"这个词感觉摸不着头脑。今天数学课讲分岔图形的时候我才发现原来这就是数学之美。这让我感觉到欣慰(这么复杂?!还好不考)而又震惊(什么?!考试考这个)。

什么叉形分岔、鞍结分岔、跨临界分岔、滞后分岔、Hopf分岔。。。我看到这些只感觉脑袋要分岔。
能不能让我随时切换到多头形态,让我一边完成课程作业,一边调模型,一边改论文,一边做项目,一边帮老师干活,一边写文案啊。

不过今天雨后的天气好好看,看到天空感觉心情都好很多了。

祝大家国庆快乐,也祝大家都要开心啊!
00
Nothing_8
1年前
"1024x768的输入"
"issue反馈用A800 80G 微调爆显存"
"嘿嘿,VIT来喽!"
被硬控1h
arxiv.org
00
Nothing_8
1年前
咋这么开心啊!!!!!!!!
10
Nothing_8
2年前
R3F项目小结
​1.这次需要自己建模,所以浅学了一下Blender,我的学习路线是(三木哥语气):
1>B站辣椒酱第零、一章,对Blender界面,变换操作等基础知识有个了解
2>第二章根据实际需求观看,我这次用到挤出工具比较多,所以主要看这个地方
3>直接实战,留意自己无法解决或处理麻烦的问题,带着问题去看部分实战视频(UV贴图,材质处理等)
4>导出gltf模型
​2.R3F相关
1>摄像头position和控制器target两者的变换不建议用参数绑定props的方式实现,当绑定值更新时,可能有时会出现读取数据错误的情况。当然这个问题可以通过写update解决,但会比较麻烦,出错排查也困难。
​我是用state只控制更新操作,当需要变换的时候直接通过uesThree中的camera和controls进行修改操作。
2>r3f的drei整合了很多第三方threejs库,如果你在其它地方看到非常好的库,建议先去drei瞅一眼,可能直接集成了。如果集成的话建议优先使用drei内置,这样不用考虑extend的问题
3>这次的样式库使用了shadcn-ui,建议只用它的手动实现,他的npx管理容易脏环境
4>PointLockControl在部分浏览器的兼容性仍存在问题,vivaldi浏览器甚至无法唤回光标,如果想使用的话建议小心。
5>drei内的CameraControl好像对dolly zoom的限制太宽松,所以你在滚轮缩放的时候可能会出现视角螺旋转动的情况。可以根据自己需求进行修改。
6>CameraControl的fitToBox很实用,可以用这个快速实现物体聚焦。
7>如果你是想简单实现动画,可以使用现有的3D动画库,如果需要考虑到多因素的话,建议大道至简,只用tween或gsap就可以。
现在很多3D动画库会让你用他们定制的Canvas或Camera,但在你修改的时候很容易出现问题且定位困难(比如react-spring和framer motion),改来改去容易本末倒置白忙活。
​3. 其他
1>单面内容如果太多太密的话,可能会出现线性差值贴图模糊,最近差值贴图过糙的问题。可以根据自己需求进行分段切图,将关注板块分别切成独立图然后再附上去(贴平面或者改UV什么的),这样效果会好很多。
2>有的环境hdr贴图太亮,切换环境贴图后可能部分模需要调整一下自适应发光。

目前能想到的大概就是这些。
00
Nothing_8
2年前
工作机硬盘突然掉盘,系统盘数据全部丢失,好在数据都有保留。正好趁这个机会重新整理一下,反思目前使用环境遇到的问题,并尝试改正。
# 系统方面
之前的方案是ventoy便携linux,当时的想法是笔记本和工作机环境无缝切换。但后期发现两设备驱动条件严苛有时会因为驱动冲突无法正常开机,再加上bspwm的兼容性问题以及额外的win需求,所以不得不放弃这个方案。
目前打算还是以win为主,最近任务比较多没有精力去完善工作区,而且因为需求跨度大可能需要安装多生态软件。但这又有两个问题:
- 某些生态下的软件非常吃资源,部分服务会严重影响日常使用体验,如果手动关闭服务,后期唤醒时又需要解决服务恢复问题(重置配置文件状态)
- 当需求结束,卸载一系列软件时,软件残留多,而且会有奇奇怪怪的卸载服务驻留。
能不能用虚拟机那种“快照”方式去解决类似问题呢?可以,我之前的想法是根据需求封装母盘和基础盘,但又有新的问题:
- 封装的时间成本较高,某一阶段封装完成大概需要两三个小时
- 封装后镜像在释放时部分应用会出现掉配置的问题
- 母盘封装工具NTLite正版授权太贵,用别人的母盘不放心
所以我放弃了封装镜像的方式,尝试了差分VHDX的方法,该方法有几个比较好的地方:
- 系统放在镜像中,方便备份处理
- 便携性强,配合ventoy后可以快速实现WTG,且不会搞脏文件目录
- 根据需求实现差分系统,实现多层快照与多级快照操作
- 相比镜像封装,不需要考虑OOBE后的奇怪情况
大概实现的过程如下:
1. 创建vhdx,初始化为mbr分区
2. 安装镜像(选择自己之前精简的Win10 2004 Pro 母盘)
3. 准备一个U盘,制作ventoy启动盘,拷贝vhd启动插件至U盘ventoy目录下
4. ventoy引导至vhdx系统(如果vhdx在本地磁盘可以按F2进行本地引导)
5. 如果引导时提示无法正确配置,可以尝试命令跳过oobe或修改注册表跳过oobe(具体的命令我明天放到评论区)
6. 进入系统,装驱动和安全软件,配置日常软件
7. 重启回到本地系统,使用BOOTICE制作差分系统
8. ventoy引导至差分vhdx差分系统,检查是否正常
其中如果有些软件数据重要且需要多系统同步的,建议将其放到非虚拟盘位置,这样不仅能减少vhdx空间,也能方便后期差分多系统共同调用一个软件。
# 日用环境方面
- 目前是所有软件以便携版优先,且数据尽可能实现云同步。这样能够减少跨设备带来的不适感。
- 笔记系统从Obsidian转至Logseq中。目前我没有较长时间段去认真写长文章,很多时候都是灵光一闪简单记录。但Obsidian太重了,很容易有一种内容契合体系的感觉,所以这边就尝试转至Logseq。除此之外,我将我目前较早的笔记迁出至笔记库,放到VuePress作为第三方知识库,简单的隔离能让我目前的笔记库体系更加贴近于当前情况,臃肿度也小一点。(doc.59188888.xyz
- 之前已完结的项目全部归档,不去和当前项目夺视野。
- 图床归一,全部拉下本地并上传至同一图床,原图床账号全部清空
github.com
# 服务器方面
目前主要想实现几个点:
- 固定工作机能够保证基础活动正常(云同步,图床,WEBDAV)
- 活动地点能够保证可以快速分享内容(网址、笔记、标记、小文件)
- 内容记录正常无影响(知识库,随记,RSS)
- 大概就是这些,最近对现在科技和人性一直处于高度失望的状态,所以很多想做的事情没有往前推,希望这次也能让我的心更ready一下吧。
00
Nothing_8
2年前
今天试了一下没有做完,但我感觉可行性挺高。
我的大概思路是:魔改第三方字幕插件,使用插件向后端服务器发送youtube视频id并进行字幕渲染,后端服务器首先检测有没有官方字幕,如果有的话就下载直接交给GPT,如果没有的话就使用语音识别生成字幕再送到GPT识别。
今天大概的过程如下:
1. 先找第三方字幕插件 yashagarwal1411/SubtitlesForYoutube 尝试魔改。
该插件的字幕源并非官方,而是Amara和OpenSubtitles,这两个来源字幕资源都严重不足。所以尝试修改数据源,他的网络源有些实现比较取巧,如果修改的话比较麻烦,所以从本地字幕上传入手,定位到loadsubtitle函数,确定字幕加载接口。而且经本地测试后,切换字幕不会出现闪烁现象,所以轮询获取最新字幕文件的方法可行性很高。
2. 后端相关,语音识别这个地方是比较大的坑,目前网络API大都以单音频识别为主,必须得整段送入才可以获取最终识别结果。等待时间过长会很破坏体验。如果强硬截断音频识别效果又会出现问题,说了一半被截断,后半部分的语义很容易歪。
说话人识别技术可以很好的解决类似问题,但目前落地应用太少了,之前看到的很多案例仍根据分贝判断。所以我尝试有没有第三方可以做到说话人识别 和 语音识别相结合的算法。
自建Whisper在语毕判断这方面也有一定的能力,而且其也可以实现过程输出(修改verbose参数对应部分),但其资源占用可能仍是一个比较严重的问题,small需要3G左右显存,tiny虽然不太吃资源但识别效果非常糟糕。
还没有找到更好的选择,WhisperX的过程输出部分砍掉了(仓库也有人提issues),fast-whisper的好像也砍掉了,Whisper-cpp可以实现,但无法很好实现开发框架兼容,估计到时候得echo一下,然后让后端服务器去读。
想法可行,但我还得想几个点:
1. 资源占用问题:whisper太吃服务器资源,买VPS成本太高。以后尝试低占用替代或只找说话人识别相关模型,识别直接交给第三方语音识别API。
2. 翻译是否精确:不同语境可能也需要不同的prompt,可能在插件界面放一个prompt设置比较好。
3. GPT请求问题,最近OpenAI又开始封账号了,而且加了API调用限制,可能后期需要多个api并行请求翻译。
我就抛砖引玉一下,如果有成熟方案我学习学习,如果没有的话我尝试做一个demo。 //@InClouds: 预加载1分钟内容 buffer概念。可以节省token避免浪费。

InClouds: 各位熟悉AI工具的朋友,我目前的有个强烈需求,描述下: ——实时Youtube字幕翻译生成与自动播放。 Youtube上有许多行业相关视频和教程,有的Youtube本身提供了中文字幕,有许多没有。当然平台提供了 Auto-generated 翻译,但准确性不足。 有没有Chrome的插件可以实现以下体验: 打开一个Youtube页面,如果检测到是英语,开始播放后,直接在视频字幕位置,自动实时播放“准确中文字幕”。 最好开放OpenAI API设置(和其他大多数插件一样) 注:要的不是“该视频文字稿或大意Summary“(这个功能已有好几个工具可以做到了),要的是随视频实时播放的翻译后的中文字幕播放体验。

00