内容简介:最近想写个TWITTER账号爬取程序,本以为很容易,没想到却碰到了不少坑。 1. TWITTER页面元素里ID是变化的。当你下来页面时候,用网页开发者工具查看,ID是变化的。前面是ID,ID后面紧跟一大串数字。当用selenium查找元素时候,会经常找不到。 2,当使用find_elements查找用户时候,本以为可用根据XPATH顺序查找到元素。结果发现连续爬取30个用户名称后...
用户评论