关于ChatGPT爬虫实现,经验分享 先说结论: 1)原因:由于ChatGPT并不会真
关于ChatGPT爬虫实现,经验分享先说结论:1)原因:由于ChatGPT并不会真的联网去查看网页结构,因此——网页的解析是瞎编的,所以直接返回的代码,无法获取有效数据。2)解法:需要指定一大堆参数,包括内容所在的class、encoding、输出的链接格式等。明确指定之后,可以给出有效的代码。3)难点:指定翻页按钮,要求自动翻页,仍未解决。似乎会陷入死循环。如果不能翻页,爬虫就只能当个demo玩了。4)小结:目前ChatGPT的写爬虫的能力,完全帮不到小白。必须有非会员试读19%,加入社区后可阅读全文 感谢<e type="mention" uid="142542582552" title="%40%E5%A4%A7%E9%93%AD%F0%9F%8D%80" /> <e type="mention" uid="88812844212522" title="%40Lautitia" /> 的反馈建议。 爬虫的问题,估计会有更好的第三方网站工具,结合网站结构解析+ChatGPT写基础代码来实现。各位星友如果发现好的工具,麻烦推荐分享 翻页没解决。有没有大佬能,指导一下【翻页按钮】的需求,怎么喂给ChatGPT? 如果不是为了练习用 ChatGPT 写爬虫,而是解决业务需求,那么建议使用很多爬虫工具,会更高效 我也用一些采集器软件,便利性挺好的 翻译主要通过找出源地址规律性,然后遍历 谢谢 你可以用bing试试。他刚出来的时候我试过。确实是可以完成简单的工作的,比如:爬取百度热点前5条。
页:
[1]