YULIN

利用Chrome插件制作亚马逊爬虫

  • 如果你尝试过去编写亚马逊爬虫,你可能会发现会遇到重重困难。在我经历过多种方式对尝试下,最终选出了最优方案——Chrome插件。Chrome插件可以通过domain网址判断当前访问的网页是否是亚马逊。然后直接将写好的js插入到页面中去执行。剩下的工作只需要找一下你需要的数据的接口,然后直接用ajax去请求就好了。请求到了数据再把数据处理后请求到后台。这样就完成了亚马逊数据的爬取。
  • 在第一次登录的时候设置记住登录状态不再向本机索取二次验证,以后可以保持登录状态长时间不会过期,如果检测到登录过期,可以通过注入的js代码实现自动刷新页面跳转登录,然后js表单填写,模拟点击登录按钮完成掉线重链操作。

请输入图片描述

图片右侧为注入的js代码编写的插件控制台,支持自动切换国家地区