发包方shaoshao
数据采集与分析
项目类型
1千~5千
项目预算
10天
预计开发时间
不限
区域限制
项目内容描述
通过若干搜索词去各大网站去采集,分成4个爬虫程序(百度爬虫、微博爬虫、微信爬虫、头条爬虫),独立运行。提供源码及6个月售后服务。支持多线程、代理IP去采集,提高采集效率,内置打码接口,尽量避免触发打码,要考虑对方反爬虫,支持动态页面抓取,要能持续采集,采集到的数据要完整,不要有乱码。不需要界面,数据直接入Mysql数据库。
要求精通python爬虫开发,时间充裕,希望能长期合作。
竞标人数:2人 剩余竞标席位:28人