即刻App年轻人的同好社区
下载
App内打开
Franco.范
175关注663被关注3夸夸
⭐️AI创业者丨PM丨Coding
👉🏻产品Miku hellomiku.com
🚀做AGI其中的布道者
人生故事:连接点 爱与失去 死亡
Franco.范
2天前
找回那种沉浸在代码世界里的快乐
00
Franco.范
14天前
今天在飞机一直在思考做产品的流程.... 比以前开悟了些

AI创业一定不是像互联网那样先凑钱融资再开干,而是小团队自己找到PMF,逻辑就更偏向于 想清楚客户是谁-服务于谁 - 什么渠道获取到这个群体客户 - 创造这个价值的付费意愿比例- 再开始设计产品 (其中更重要的将商业设计融合进产品中)和互联网很不一样的地方是可能打正ROI再做放量增长会更好一些 关注ARR的重要性
20
Franco.范
14天前
拎着白箱子就想起《当幸福来敲门》
00
Franco.范
18天前
本质上还是通过大模型+函数工具调用,只是相对以往简单的API和函数工具,现在让大模型感知了计算机的整体环境,并通过调用相关操作系统工具包进行环境交互。更多详情可以参考官方文档:docs.anthropic.com

晚点出测评文章...
00
Franco.范
20天前
人工智能代理框架的发展方向是什么?

CrewAI、Autogen、LangGraph、LlamaIndex Workflows、OpenAI Swarm、Vectara Agentic、Phi Agents、Haystack Agents......好多啊。
00
Franco.范
20天前
分享一个Github 收录了大多数的LLM论文

地址👉🏻github.com
01
Franco.范
20天前
阿里巴巴、人大开源的一款无需OCR的文档处理模型:mPLUG-DocOwl 1.5,它可以原生理解文档、网页、表格、图表,看得懂复杂的商业报告、网页截图、数据表格

1、可以解析文档结构,理解各个部分的关系
2、能将表格和图表转换成Markdown格式
3、可以定位和识别图片中的文字,整段文字或单个词都可以
4、能回答关于文档内容的问题,可以给出简短答案,也能提供详细解释

论文地址👉🏻 arxiv.org

https://github.com/X-PLUG/mPLUG-DocOwl/tree/main/DocOwl1.5

12
Franco.范
23天前
ASR + LLM +TTS 做一个实时语音交流的对话程序
整个产品的技术架构流程图如下
名词解释:自动语音识别(ASR)、大型语言模型(LLM)和文本转语音(TTS)技术
00
Franco.范
24天前
还记得22年在做的大学社区平台,当时ChatGPT3.5刚火,我们就把它植入在社区里做自动发帖自动评论..
20