发包方提交了项目

2025-10-20

审批通过,项目发布

2025-10-21

发包方选定承接人,项目进入开发

计划全部完成,项目完工

重复文档比对算法开发 竞标中:剩余13天

发包方S_326951

数据采集与分析

项目类型

待商议

项目预算

90天

预计开发时间

不限 不限

区域限制

项目内容描述

1.需求概述:通过对采集到的数据内容进行智能分析匹配,找到历史信息中的重复文档,并给出处理建议。
2.需要提供一套算法,可以实现从10万个文档中找到重复的文档,要求能够提供重复度。
传统的方法是两两对比。但是如果要实现10万个文档的对比,需要对比100000*100000/2= 50亿次。如果每次对比1秒,那么需要使用57870年。
这样的对比是不现实的,因此要求提供的算法不需要对比那么多次,可以提取每个文档的特征,然后后续文章通过特征对比即可。
如果有开源的算法,建议使用开源的算法。不建议自己开发算法。
注:不要电话联系。

 

竞标人数:7人 剩余竞标席位:13人

我要竞标

温馨提示:

1. SxSoft提供“在线担保”服务,项目款提前托管到平台,保障双方权益;

2. 线下交易产生的纠纷,本平台无法协助解决,无法保障到款;

3. 本平台服务费用为5%,行业内最低,保障最到位;

4.诱导发包方线下交易,会被平台封号

5. 很多接包方反映线下交易无法收到尾款。

如您有任何疑问,请咨询客服

客服QQ

客服1: 点击这里给我发消息

客服2: 点击这里给我发消息

客服邮箱