发包方提交了项目

2019-04-19

审批通过,项目发布

2019-04-19

发包方选定承接人,项目进入开发

计划全部完成,项目完工

2019-05-31

python搜索引擎系统开发 弃标项目

发包方tuishou

其它分类项目

项目类型

1千以下

项目预算

10天

预计开发时间

不限

区域限制

项目内容描述

搜索引擎系统主要分为三部分:信息采集模块、基于系统插件结构的主题过滤模块和基于ApacheSolr索引服务器的中文分词预处理模块。网络爬虫模块负责根据要爬虫的网页的URL集(预取列表)进行网页爬虫。在爬行过程中,提取并分析页面的脚本内容,用正则表达式匹配Ajax请求。如果包含Ajax请求,则使用htmlUnit来处理当前页面,以便在完成页面中获取JS的所有静态页面。主题过滤模块主要基于朴素贝叶斯算法,结合系统插件构建的特殊机制,实现主题过滤功能,达到主题爬虫的效果。信息预处理模块是将存储的Web内容解析为字段并将其转换为最基本的索引表示单元项(term)的过程。针对系统本身是面向英语的特点,在系统中添加中文分词插件,更好地实现检索策略的本质“关键词匹配”,然后建立反索引,对过滤后的词汇单元进行分析,达到快速检索信息的目的

 

竞标人数:2人 剩余竞标席位:28人

我要竞标

温馨提示:

1. SxSoft提供“在线担保”服务,项目款提前托管到平台,保障双方权益;

2. 线下交易产生的纠纷,本平台无法协助解决,无法保障到款;

3. 本平台服务费用为5%,行业内最低,保障最到位;

4.诱导发包方线下交易,会被平台封号

5. 很多接包方反映线下交易无法收到尾款。

如您有任何疑问,请咨询客服

客服QQ

客服1: 点击这里给我发消息

客服2: 点击这里给我发消息

客服邮箱