Nothing_8的个人主页

即刻App年轻人的同好社区

下载

Nothing_8

75关注233被关注1夸夸

Nothing_8

26天前

今日vibe笑话

用户：请你处理一下，返回一个dict

cc怎么做呢：
1.返回了一个list（啊？）
2.去检测这个list的类型是否为dict（啊？？）
3.如果不是dict，则视为异常，fallback处理成一个空dict（啊？？？）
4.封装成一个特定配置文件
5.继续封装成一个configLoader
6.继续封装成一个dataLoader
7.去接入一个新的dataLoader，当然不出意外的，也会有新的configLoader
8.这其中，每一环都会有一个奇怪的class和一个奇怪的fallback

每一次debug就像断案一样抽丝剥茧，每一个函数都感觉像被cc包装成犯罪嫌疑人，每一次翻代码都不得不让我感叹，“藏的真好，怪不得我找不到”

如果A社的PKI靠token用量评估，那个优化prompt的哥们一定会捧起属于自己的奖杯吧。

一个月前的LLM：难道vibe coding真的是未来吗？！
也现在的LLM：
- gpt5-codex：养生，五个项目开着还能让用户去坑边钓会鱼
- gemini：我碎嘴子是为了overloaded
- claude：你说的对，但我的降智是善意的
- glm：我的限速也是善意的，但一码归一码，事我只办这点，有别的事后面再说

现在的主流非开源模型的相互掣肘，在不可避免的降智过程后显得如此平等，都变成了高考后的朦胧少年。
朦胧少年青涩纯真有活力我理解，但能不能不要收我那么多的token费用啊喂！

最近的感触总结：
垃圾代码防破解，论文代码防复现；
混淆代码防解决，vibe代码防上线。

3 00

Nothing_8

1年前

国庆用Power Automate干活，简单说一下踩过的坑。

## 循环任务下最好找不重复的标识符
使用Power Automate处理循环任务时，最好找一个无重复的标识符。因为Power Automate的循环任务做不了”let item of items”这种情况，无论是对items做操作，还是想办法提取出item，都会有很多奇奇怪怪的问题。
官方给的解决方案是如果有重复元素，可以使用order变量来进行索引。而这就会有另一个问题，order是全局索引，如果我选择特定的iframe特定的表格，里面超链接的order不会是1，而是26(其他页面的25个超链接加上这个1个超链接)。这就意味着如果我这个循环外面再套一层任务的话，那么每次执行任务我都需要调整初始索引以正确遍历到目标超链接。
那么初始索引在哪里呢？这就是新的问题，每次初始索引的获取我都需要去进行手动操作，就很费劲。
除此之外获取索引的方式也有问题，目前我已知的方式有”从网页中提取数据”和”添加UI元素”两种方式，前者倾向于类选择器定位，后者倾向于id选择器定位。前者的有效性只存在调试页面，刷新一下就失效了，所以我一直在使用后者的方式。
不过这就又有了新的问题，Power Automate会经常出现定位偏移的情况，你捕获的order是26，但实际的order是3，所以我还需要进行多次测试以定位到正确位置。

## FluentUI是一款开放世界UI，后面卡了
得益于微软最新流行的FluentUI设计，Power Automate特别特别特别卡。调试的网页经常掉用户session，我这边本想开虚拟机调试（6C6G），没想到调试过程中Power Automate频繁卡死，每一次点击都会让你产生”kale”的喜悦。

## 网页自动化问题
如果有两行超链接的话，Power Automate不会点上行文字也不会点下行文字，它会点正中间，这就导致点击无法触发（拳头硬了）。目前的解法只能是强行缩小比例来减少文字行数，或者是使用油猴脚本改一下超链接文本的overflow。

## 疑似缓存问题
如果多次运行会出现浏览器和Power Automate双卡死的情况，感觉像是奇怪的缓存问题，需要定时重启Power Automate和刷新浏览器。

## 其他小问题
1. JS调用函数间歇性失灵，当次运行ok下一次就完了。
2. 插入变量时最好使用文本编辑器模式，低代码传入变量的话有时会自动变空。

Power Automate感觉目前只适合做辅助工具，它在全自动化设计中问题还是非常多，不建议作为RPA的可靠选择。
这次就不该在DDL较劲的情况下完全依赖大公司的低代码平台。后期还是需要调研支持Python的RPA。

10月7号晚上10点，nothing突然说”完事喽！”，然后愉快的开学了。（欣慰沉睡.jpg）

0 00

Nothing_8

1年前

数学总是会在出其不意的地方给你个大嘴巴子。告诉你无论在什么时候都不要得意忘形。

计算似严父，图像如慈母。
计算会在你做出"1+2=7"的壮举后告诉你完全失败，重新再来。图像总会露出温和而又美丽的笑容，让你只可远观不可亵渎。
（为什么说亵渎，就不得不提等差数列应用案例---炉石传说了）

想起研二的时做数学元宇宙项目时，看到"数学之美"这个词感觉摸不着头脑。今天数学课讲分岔图形的时候我才发现原来这就是数学之美。这让我感觉到欣慰（这么复杂？！还好不考）而又震惊（什么？！考试考这个）。

什么叉形分岔、鞍结分岔、跨临界分岔、滞后分岔、Hopf分岔。。。我看到这些只感觉脑袋要分岔。
能不能让我随时切换到多头形态，让我一边完成课程作业，一边调模型，一边改论文，一边做项目，一边帮老师干活，一边写文案啊。

不过今天雨后的天气好好看，看到天空感觉心情都好很多了。

祝大家国庆快乐，也祝大家都要开心啊！

7 00

Nothing_8

1年前

"1024x768的输入"
"issue反馈用A800 80G 微调爆显存"
"嘿嘿，VIT来喽！"
被硬控1h
arxiv.org

2 00

Nothing_8

1年前

咋这么开心啊！！！！！！！！

4 10

Nothing_8

2年前

R3F项目小结
1.这次需要自己建模，所以浅学了一下Blender，我的学习路线是（三木哥语气）:
1>B站辣椒酱第零、一章，对Blender界面，变换操作等基础知识有个了解
2>第二章根据实际需求观看，我这次用到挤出工具比较多，所以主要看这个地方
3>直接实战，留意自己无法解决或处理麻烦的问题，带着问题去看部分实战视频（UV贴图，材质处理等）
4>导出gltf模型
2.R3F相关
1>摄像头position和控制器target两者的变换不建议用参数绑定props的方式实现，当绑定值更新时，可能有时会出现读取数据错误的情况。当然这个问题可以通过写update解决，但会比较麻烦，出错排查也困难。
我是用state只控制更新操作，当需要变换的时候直接通过uesThree中的camera和controls进行修改操作。
2>r3f的drei整合了很多第三方threejs库，如果你在其它地方看到非常好的库，建议先去drei瞅一眼，可能直接集成了。如果集成的话建议优先使用drei内置，这样不用考虑extend的问题
3>这次的样式库使用了shadcn-ui，建议只用它的手动实现，他的npx管理容易脏环境
4>PointLockControl在部分浏览器的兼容性仍存在问题，vivaldi浏览器甚至无法唤回光标，如果想使用的话建议小心。
5>drei内的CameraControl好像对dolly zoom的限制太宽松，所以你在滚轮缩放的时候可能会出现视角螺旋转动的情况。可以根据自己需求进行修改。
6>CameraControl的fitToBox很实用，可以用这个快速实现物体聚焦。
7>如果你是想简单实现动画，可以使用现有的3D动画库，如果需要考虑到多因素的话，建议大道至简，只用tween或gsap就可以。
现在很多3D动画库会让你用他们定制的Canvas或Camera，但在你修改的时候很容易出现问题且定位困难（比如react-spring和framer motion），改来改去容易本末倒置白忙活。
3. 其他
1>单面内容如果太多太密的话，可能会出现线性差值贴图模糊，最近差值贴图过糙的问题。可以根据自己需求进行分段切图，将关注板块分别切成独立图然后再附上去（贴平面或者改UV什么的），这样效果会好很多。
2>有的环境hdr贴图太亮，切换环境贴图后可能部分模需要调整一下自适应发光。

目前能想到的大概就是这些。

1 00

Nothing_8

2年前

补档
www.aliyundrive.com //@虾仁是我: 不能看了，还能再分享下吗🙃

Nothing_8: 整理硬盘的时候发现了考研时的王道数据结构笔记，感觉还是得让它发挥余热，分享给有需要的人。内容主要是王道数据结构视频和个人理解。我考研数据结构考了145分（满分150），身边的同学对这份笔记评价也很高。所以我感觉应该能帮到考研的同学吧不过因为是个人笔记，可能还会有没发现的错误，建议还是自己推一下代码片段。希望能帮到大家。

0 00

Nothing_8

2年前

工作机硬盘突然掉盘，系统盘数据全部丢失，好在数据都有保留。正好趁这个机会重新整理一下，反思目前使用环境遇到的问题，并尝试改正。
# 系统方面
之前的方案是ventoy便携linux，当时的想法是笔记本和工作机环境无缝切换。但后期发现两设备驱动条件严苛有时会因为驱动冲突无法正常开机，再加上bspwm的兼容性问题以及额外的win需求，所以不得不放弃这个方案。
目前打算还是以win为主，最近任务比较多没有精力去完善工作区，而且因为需求跨度大可能需要安装多生态软件。但这又有两个问题：
- 某些生态下的软件非常吃资源，部分服务会严重影响日常使用体验，如果手动关闭服务，后期唤醒时又需要解决服务恢复问题（重置配置文件状态）
- 当需求结束，卸载一系列软件时，软件残留多，而且会有奇奇怪怪的卸载服务驻留。
能不能用虚拟机那种“快照”方式去解决类似问题呢？可以，我之前的想法是根据需求封装母盘和基础盘，但又有新的问题：
- 封装的时间成本较高，某一阶段封装完成大概需要两三个小时
- 封装后镜像在释放时部分应用会出现掉配置的问题
- 母盘封装工具NTLite正版授权太贵，用别人的母盘不放心
所以我放弃了封装镜像的方式，尝试了差分VHDX的方法，该方法有几个比较好的地方：
- 系统放在镜像中，方便备份处理
- 便携性强，配合ventoy后可以快速实现WTG，且不会搞脏文件目录
- 根据需求实现差分系统，实现多层快照与多级快照操作
- 相比镜像封装，不需要考虑OOBE后的奇怪情况
大概实现的过程如下：
1. 创建vhdx，初始化为mbr分区
2. 安装镜像（选择自己之前精简的Win10 2004 Pro 母盘）
3. 准备一个U盘，制作ventoy启动盘，拷贝vhd启动插件至U盘ventoy目录下
4. ventoy引导至vhdx系统（如果vhdx在本地磁盘可以按F2进行本地引导）
5. 如果引导时提示无法正确配置，可以尝试命令跳过oobe或修改注册表跳过oobe（具体的命令我明天放到评论区）
6. 进入系统，装驱动和安全软件，配置日常软件
7. 重启回到本地系统，使用BOOTICE制作差分系统
8. ventoy引导至差分vhdx差分系统，检查是否正常
其中如果有些软件数据重要且需要多系统同步的，建议将其放到非虚拟盘位置，这样不仅能减少vhdx空间，也能方便后期差分多系统共同调用一个软件。
# 日用环境方面
- 目前是所有软件以便携版优先，且数据尽可能实现云同步。这样能够减少跨设备带来的不适感。
- 笔记系统从Obsidian转至Logseq中。目前我没有较长时间段去认真写长文章，很多时候都是灵光一闪简单记录。但Obsidian太重了，很容易有一种内容契合体系的感觉，所以这边就尝试转至Logseq。除此之外，我将我目前较早的笔记迁出至笔记库，放到VuePress作为第三方知识库，简单的隔离能让我目前的笔记库体系更加贴近于当前情况，臃肿度也小一点。（doc.59188888.xyz）
- 之前已完结的项目全部归档，不去和当前项目夺视野。
- 图床归一，全部拉下本地并上传至同一图床，原图床账号全部清空
（github.com）
# 服务器方面
目前主要想实现几个点：
- 固定工作机能够保证基础活动正常（云同步，图床，WEBDAV）
- 活动地点能够保证可以快速分享内容（网址、笔记、标记、小文件）
- 内容记录正常无影响（知识库，随记，RSS）
- 大概就是这些，最近对现在科技和人性一直处于高度失望的状态，所以很多想做的事情没有往前推，希望这次也能让我的心更ready一下吧。

1 00

Nothing_8

2年前

今天试了一下没有做完，但我感觉可行性挺高。
我的大概思路是：魔改第三方字幕插件，使用插件向后端服务器发送youtube视频id并进行字幕渲染，后端服务器首先检测有没有官方字幕，如果有的话就下载直接交给GPT，如果没有的话就使用语音识别生成字幕再送到GPT识别。
今天大概的过程如下：
1. 先找第三方字幕插件 yashagarwal1411/SubtitlesForYoutube 尝试魔改。
该插件的字幕源并非官方，而是Amara和OpenSubtitles，这两个来源字幕资源都严重不足。所以尝试修改数据源，他的网络源有些实现比较取巧，如果修改的话比较麻烦，所以从本地字幕上传入手，定位到loadsubtitle函数，确定字幕加载接口。而且经本地测试后，切换字幕不会出现闪烁现象，所以轮询获取最新字幕文件的方法可行性很高。
2. 后端相关，语音识别这个地方是比较大的坑，目前网络API大都以单音频识别为主，必须得整段送入才可以获取最终识别结果。等待时间过长会很破坏体验。如果强硬截断音频识别效果又会出现问题，说了一半被截断，后半部分的语义很容易歪。
说话人识别技术可以很好的解决类似问题，但目前落地应用太少了，之前看到的很多案例仍根据分贝判断。所以我尝试有没有第三方可以做到说话人识别和语音识别相结合的算法。
自建Whisper在语毕判断这方面也有一定的能力，而且其也可以实现过程输出(修改verbose参数对应部分)，但其资源占用可能仍是一个比较严重的问题，small需要3G左右显存，tiny虽然不太吃资源但识别效果非常糟糕。
还没有找到更好的选择，WhisperX的过程输出部分砍掉了(仓库也有人提issues)，fast-whisper的好像也砍掉了，Whisper-cpp可以实现，但无法很好实现开发框架兼容，估计到时候得echo一下，然后让后端服务器去读。
想法可行，但我还得想几个点：
1. 资源占用问题：whisper太吃服务器资源，买VPS成本太高。以后尝试低占用替代或只找说话人识别相关模型，识别直接交给第三方语音识别API。
2. 翻译是否精确：不同语境可能也需要不同的prompt，可能在插件界面放一个prompt设置比较好。
3. GPT请求问题，最近OpenAI又开始封账号了，而且加了API调用限制，可能后期需要多个api并行请求翻译。
我就抛砖引玉一下，如果有成熟方案我学习学习，如果没有的话我尝试做一个demo。 //@InClouds: 预加载1分钟内容 buffer概念。可以节省token避免浪费。

InClouds: 各位熟悉AI工具的朋友，我目前的有个强烈需求，描述下： ——实时Youtube字幕翻译生成与自动播放。 Youtube上有许多行业相关视频和教程，有的Youtube本身提供了中文字幕，有许多没有。当然平台提供了 Auto-generated 翻译，但准确性不足。有没有Chrome的插件可以实现以下体验：打开一个Youtube页面，如果检测到是英语，开始播放后，直接在视频字幕位置，自动实时播放“准确中文字幕”。最好开放OpenAI API设置（和其他大多数插件一样）注：要的不是“该视频文字稿或大意Summary“（这个功能已有好几个工具可以做到了），要的是随视频实时播放的翻译后的中文字幕播放体验。

4 00

Nothing_8

2年前

ypsilon: 我可以的，我现在做梦都tm要笑醒

1 00