在 Python 爬虫的时候遇到的 JS,几种策略
- pyv8 只支持 python2,容错高
- PyExecJS,支持到 python3,容错率低,同样的代码 pyv8 执行 ok,但是这个报多余的分号…
- phantomjs,动态渲染页面执行 js,主要是不好 kill 掉,不直接杀进程内存能 gg
- 手动解析 script,也是一种方案,主要是 py 处理一下混淆
- py 调 os.system 再解析,这种就是依赖本地另一个工具,比如 node 之类的,解析 js 再返回结果,增加外部依赖
在 Python 爬虫的时候遇到的 JS,几种策略