晓峰 发表于 2023-3-12 20:07:08

想知道chatpdf是如何实现的吗?经过几天的分析形成的软件开发原理解析。 希

想知道chatpdf是如何实现的吗?经过几天的分析形成的软件开发原理解析。希望能共同探讨,感谢!%E7%81%AB%E7%88%86%E5%B7%A5%E5%85%B7chatpdf%E5%8E%9F%E7%90%86%E8%A7%A3%E6%9E%90
非会员试读19%,加入社区后可阅读全文

牛皮马甲 发表于 2023-3-12 20:36:03

请问Embeddings API投喂的数据是永久存储在open AI上面的吗?还是说每一次都必须在自己的服务器上面搜寻相关向量提交到openai

晓峰 发表于 2023-3-12 20:45:39

不是,数据实际还是存在自己服务器或第三方数据库服务器上的,只不过向量化是通过openai的api来做的

牛皮马甲 发表于 2023-3-12 22:11:06

感谢您的回复,那我用es之类的全文搜索引擎搜索相应的部分,然后提交似乎也是一样的?

大铭 发表于 2023-3-12 23:52:09

不一样,因为embedding这种方式通过向量计算,也就是会有自然语言的处理,比如不同问发会知道问一个事情,而es则必须有关键字的匹配

晓峰 发表于 2023-3-13 09:53:01

结合es来实现在某些情况可能更高效[微笑]

Frank老师 发表于 2023-3-13 12:10:50

实测:<e type="web" href="https%3A%2F%2Fmp.weixin.qq.com%2Fs%3F__biz%3DMzg2MzgyMzI3Nw%3D%3D%26mid%3D2247483873%26idx%3D1%26sn%3Dcf5debe9431c09e2eb5609d5a4b31229%26chksm%3Dce73f523f9047c350f770da4d876daa66802e9b8a52c728a5f649809a4becadb355fbf1e2365%26mpshare%3D1%26scene%3D1%26srcid%3D0313IX6bQJXouYJqq13QHBaU%26sharer_sharetime%3D1678677651972%26sharer_shareid%3D4c9452722b497bd42d254e0440795d8f" title="ChatGPT%E5%AE%9E%E6%88%98+%7C+ChatPDF%E8%BD%BB%E6%9D%BE%E8%A7%A3%E6%9E%90%E5%90%84%E7%B1%BBPDF%E6%96%87%E6%A1%A3" />

晓峰 发表于 2023-3-13 12:15:38

[强]

牛皮马甲 发表于 2023-3-13 12:53:41

感谢回复,我对向量的理解还停留在比较两块文本相似度上面
页: [1]
查看完整版本: 想知道chatpdf是如何实现的吗?经过几天的分析形成的软件开发原理解析。 希