发包方bjhwkj88
其它分类项目
项目类型
5千~1万
项目预算
7天
预计开发时间
不限 不限
区域限制
项目内容描述
目前需求:
解决快手搜索采集问题。有现成的代码算法更好。
解决抖音搜索采集问题。有现成的代码算法更好。
完成bilibi搜索采集需求。有现成的代码算法更好。
目前需要采集2000多个关键词的搜索结果(主要是高校名称,见附件)。要求每天运行3、4次,能稳定长期采集。
技术要求:
熟悉安卓或者ios逆向,能提取主流app的数据。
熟悉js前端混淆逆向。
精通?python?语言开发,具有大型在线服务开发经验。
熟悉scrapy等开源爬虫框架。
掌握网页抓取原理及技术,了解登录原理,熟悉网页抽取技术。
熟悉反爬机制,能解决爬取过程中疑难问题。
根据业务需求,实现文本、图片、视频数据抓取、清洗、存储等工作。
熟悉软件开发流程,有良好的技术文档习惯,有规范化标准化的代码编写习惯。
发包方选择 “精选接包方” 项目, 8 人可参与竞标,竞争更少。
竞标人数:3人 剩余竞标席位:5人