即刻App年轻人的同好社区
下载
App内打开
钱塘创客
604关注35被关注0夸夸
钱塘创客
13:03
大家怎么看Rl agent训练开发模式和agent开发的关系是什么样的? 近期模型开发商纷纷下场推出agentic agent了🤓
00
钱塘创客
10天前
刚才发了搭建手机的ai coding环境方法,有朋友说还米有claude code账户的,可以使用anyrouter.top 今天注册可以获取100$ 的Claude code额度
00
钱塘创客
10天前
打造移动AI coding环境 实现随时随地vibe coding💪
00
钱塘创客
10天前
最近claude code和gemini code纷纷下场AI coding,都是以返璞归真的命令行cli方式出现,非常有意思。作为AI从业者,也是想着既然都命令行都来了,那总得有配套ssh远程终端啊,琢磨了一下搞了一个远程AI coding 环境。

最简单当然是直接有一台服务器可以网络无限制畅游的,直接手机端装个ssh client,直接使用服务器上AI coding cli环境,然而大部分开发者估计都没有这个条件了,钱多当我没说哈。

大部分人,可能跟我一样,只有本地pc或mac上可以使用claude code或gemini code环境,那么首先就得解决,从手机端到达自己的PC端的网络(通常是家宽或单位局域网,都是通过NAT转换访问的公网),所以就得有内网穿透的工具环境了,我测试用的tailscale app,它的工作原理是在你的pc端和手机端之间建立点对点的隧道。这里就先不讲了,大家自行摸索一下吧。

有了上面的网络环境后,剩下就是ssh client的选择了,这里测试用的temius,但是free版不支持中文输入,是一个槽点。
同时需要考虑是长久连接问题,那就是建议在PC上启动一个tmux session(tmux new-session -A -s <session_name>),然后在session中启动打开claude或gemini;然后在手机上ssh连接成功后,使用tmux (tmux attach -t <session_name>),这样就可以使用激活的cli 环境,即使手机端退出都不影响,只要再次连接上去这个session即可,这就是远程编程环境的优势,即你可以随时上去连接上session,布置完成开发调试任务后就可以离开,想起来再连接上去看看是否已经完成啥的。

最后为了更加vibe,加个语音输入法吧,大家可以试试最近很火的wispr啥的,我这边也刚花了1天半时间给自己写了个纯本地版(连模型)的语音输入法。
21
钱塘创客
16天前
刚用trae花了1天半时间写了mac上的语音输入app,体验一下wispr flow的本地版,vibe coding从此动口不动手了,语音识别用的funasr,一半时间卡在macos15.5的权限bug上了,搜了下才发现有网友4月份提出过这个bug的😪
00
钱塘创客
26天前
豆包出ai播客了www.doubao.com,notebooklm中国版,大厂活力覆盖范围😹
00
钱塘创客
2月前
想法
长期看,模型直接理解截屏是更自然更能 scale up 的做法,所有信息截屏都有,大模型应该像人一样能准确识别和操作,模型公司应该会一直在这条路上尝试。
Browser Use 是在模型能力不足时期的中间优化方案,如果这个时期足够长,它就价值很大,如果模型很快突破,它就会失去价值。
可以用同样的思路复刻 Mobile Use,iOS / Android 都有现成的 accessibility 能力,能拿到当前界面结构化的数据,只是会有沙盒的各种限制,这事很适合系统厂商去做。桌面端应该也可以。
Agent 上下游相关配套基建都处于起步阶段,小团队很有机会把其中某个点做出彩。
00
钱塘创客
3月前
一个观点,类似manus的通用agent其实是没有意义的,因为既然通用agent都实现了,那么agi也实现了;反之基于特定场景或者行业场景agent才是现阶段最容易实现和落地的方向🧭✊
00
钱塘创客
3月前
看样子要真的要写点东西了,现在网上自媒体无任是直播的还是写文章的大部分都在胡说八道,实在看不下去了……
00
钱塘创客
5月前
过年了,不要再讨论什么LLM、GPT、RLHF之类的了。你背着贴满OpenAI、DeepSeek贴纸的破双肩包回到家,发现跑了一年的对话模型根本换不来亲戚们的一句理解。老同学们晒着年终奖在酒桌上谈笑风生,你躲在厨房用手机SSH连上实验室的A100集群继续调prompt。亲戚围炉时问起你的工作成就,你掏手机展示arxiv最新预印本,说在某个benchmark上把BLEU分数卷到了99.9%,亲戚们举着筷子的手僵在半空,你还在脑内循环播放transformer的self-attention机制。你暗笑他们不懂LLM生成文本的魔力,不明白你凌晨三点调temperature参数的禅意,更看不懂你GitHub仓库里那串寒碜的几个star。当大姑炫耀儿子在浦东买了150平豪宅,小叔吹嘘女儿又换了新款Model X时,你父母低头扒饭,嘟囔着“我崽的键盘上全是Ctrl+C/V的痕迹,空调房还戴毛线帽,说是什么防止模型过拟合”。你凌晨三点蹲在老家路由器旁边抢API调用配额,发现OpenAI的API账单比老家彩礼还贵。家族群里红包雨下得正欢,你反手甩出刚中的ACL workshop链接,配文“大模型幻觉问题新SOTA,欢迎讨论”。结果大舅秒回:“这链接点不开啊,是不是你那个‘幻觉问题’又发作了?”你默默叹了口气,心想:“果然,LLM的幻觉问题连亲戚都开始吐槽了。” 表哥表姐们晒着巴厘岛度假照,你在评论区用Markdown格式分析海滩游客密度与transformer位置编码的相似性,最后补了句“求NeurIPS在投论文互审”。结果表姐回复:“你这写的啥?我怎么一个字都看不懂?”你无奈地笑了笑,心想:“果然,positional encoding的奥秘不是一般人能懂的。”然后默默关掉手机,继续蹲在路由器旁边等API配额刷新。年三十的鞭炮声里,窗外的烟花在你布满血丝的瞳孔里炸开,恍惚间竟像是预训练时loss曲线最后的震荡。深夜改完第一百零八版prompt,你默默把滚烫的电脑从大腿挪开,屏幕蓝光映着漫天的烟花,你心里默默念叨:“明年一定要卷出个AGI。
00