经常看到一些朋友探讨Costco,我就比较好奇它是怎么运作的,在微信读书里也没看到讲Costco的书。有朋友给我发了一本关于Costco前身的电子书《Sol Price零售革命家》,纯英文扫描版。现在微信读书有个问题,虽然导入英文版PDF可以阅读,并且可以开启翻译,但我想听书时,没办法只播放中文翻译内容。所以我想到的解决办法就是把英文扫描版提取内容后让AI翻译个中文版。
我先是把英文扫描版上传到Manus上尝试,但由于版权问题,Manus不给翻译。我又用Cursor来尝试,通过OCR提取每页扫描图片的内容,然后发给大模型翻译,遇到的问题是OCR把页眉页脚注脚之类的也混进去了,导致翻译的内容不纯粹。还有个问题是因为按页翻译,如果一个句子跨页面,就会导致翻译的断裂。
最后我考虑干脆直接把每页扫描版交给大模型提取内容并翻译,不要分两步。使用了Claude sonnet 4.5模型,为了保证内容的连贯性,一次提交5页,结果同样遇到了版权问题模型不给直译。于是又采取了遇到版权问题时减少提交页面数,才最终解决。前后花了七八个小时,终于做出来一份相对满意的中文版。
光Cursor请求都花了18美元,额外的代码模型API调用又花了10+美元,一共花了30美元以上,这比买本原版书都贵了。