平时我在电脑上看经济、历史类的视频,经常看不懂
.
每次都要切到豆包去问,来回切换特别麻烦
.
而且没办法把视频上下文一起带给AI,很多听不懂的概念、前后逻辑,AI也没法帮我解释清楚
.
所以我自己简单做了一个小工具,可以直接对着视频提问,学习起来爽多了!
.
这是今天半天的进度
.
核心功能实现
从零搭建了视频多模态问答工具 MVP
实现了 B 站视频链接直接上传功能
添加了 RAG(检索增强生成)功能,提升问答准确性
.
技术优化
用 TF-IDF 替代深度学习模型做 RAG,降低资源消耗
解决了 Windows 下 yt-dlp 的编码问题
优化文件命名和日志系统
添加端口自动清理功能
.
项目管理
清理了临时文件和重复环境
完善了启动脚本
#AI的神奇用法