请教各位大佬：如何使用ChatGPT有效实现爬虫？ChatGPT给出的爬虫代码，运行

Frank老师 发表于 2023-3-12 10:53:20

请教各位大佬：如何使用ChatGPT有效实现爬虫？ChatGPT给出的爬虫代码，运行不报错，但总是拿不到结果。是否需要特定的限制要求呢？示例：下面是一个简单的Python爬虫示例，可以抓取国家药品监督管理局的新闻页面 https%3A%2F%2Fwww.nmpa.gov.cn%2Fylqx%2Fylqxjgdt%2Findex.html 并提取新闻标题和链接：给出的代码，运营无效：imp
非会员试读19%,加入社区后可阅读全文

Frank老师 发表于 2023-3-12 10:54:52

测试的网页是简单网页，不存在复杂的网页结构、反爬虫逻辑

大铭发表于 2023-3-12 11:00:42

# 查找所有新闻标题和链接
news_list = soup.find_all('div', {'class': 'piclist2 clearfix'})

强烈怀疑这两句是胡写的

这个网页标题的部分是用一个 ul 结构，对应的 selector 是

#ariaqkarf74ykg0 > div.w1200-auto.bg-fff > div > div.list > ul

或者寻找 class 是 list 的 div 下的 ul 然后遍历其中的 li 即可

James 发表于 2023-3-12 11:25:50

爬虫里面还是带着业务的，已经不算是技术问题了，chatGPT应该是没有办法很好的帮你解决具体业务问题的，比如文章图片具体在哪个dom节点

页: [1]

富裕者联盟社区's Archiver

请教各位大佬：如何使用ChatGPT有效实现爬虫？ChatGPT给出的爬虫代码，运行