Frank老师 发表于 2023-3-12 12:15:34

关于ChatGPT爬虫实现,经验分享 先说结论: 1)原因:由于ChatGPT并不会真

关于ChatGPT爬虫实现,经验分享先说结论:1)原因:由于ChatGPT并不会真的联网去查看网页结构,因此——网页的解析是瞎编的,所以直接返回的代码,无法获取有效数据。2)解法:需要指定一大堆参数,包括内容所在的class、encoding、输出的链接格式等。明确指定之后,可以给出有效的代码。3)难点:指定翻页按钮,要求自动翻页,仍未解决。似乎会陷入死循环。如果不能翻页,爬虫就只能当个demo玩了。4)小结:目前ChatGPT的写爬虫的能力,完全帮不到小白。必须有
非会员试读19%,加入社区后可阅读全文

Frank老师 发表于 2023-3-12 12:15:43

感谢<e type="mention" uid="142542582552" title="%40%E5%A4%A7%E9%93%AD%F0%9F%8D%80" /> <e type="mention" uid="88812844212522" title="%40Lautitia" /> 的反馈建议。

Frank老师 发表于 2023-3-12 12:17:13

爬虫的问题,估计会有更好的第三方网站工具,结合网站结构解析+ChatGPT写基础代码来实现。各位星友如果发现好的工具,麻烦推荐分享

Frank老师 发表于 2023-3-12 12:24:09

翻页没解决。有没有大佬能,指导一下【翻页按钮】的需求,怎么喂给ChatGPT?

大铭 发表于 2023-3-12 12:34:13

如果不是为了练习用 ChatGPT 写爬虫,而是解决业务需求,那么建议使用很多爬虫工具,会更高效

Frank老师 发表于 2023-3-12 12:43:55

我也用一些采集器软件,便利性挺好的

地铁馒头 发表于 2023-3-12 17:32:05

翻译主要通过找出源地址规律性,然后遍历

Frank老师 发表于 2023-3-12 17:33:25

谢谢

crazy 发表于 2023-3-12 18:53:56

你可以用bing试试。他刚出来的时候我试过。确实是可以完成简单的工作的,比如:爬取百度热点前5条。
页: [1]
查看完整版本: 关于ChatGPT爬虫实现,经验分享 先说结论: 1)原因:由于ChatGPT并不会真