发包方SenZa15
其它分类项目
项目类型
1万~5万
项目预算
30天
预计开发时间
不限
区域限制
项目内容描述
一:基于Python制作一个算法模块,实现对PDF格式模具图纸的自动化矢量化重建,并将其转换为可编辑的DXF格式。系统需具备高精度的图像解析与几何重建能力,并确保转换结果与对应的标准CAD测试集在几何精度与图层信息上高度一致;
二:项目目标
项目内容主要包括以下三点:
1)能够自动读取并解析PDF格式模具图纸,提取图纸中的所有图形元素(轮廓线、尺寸标注、文字注释、图框与标题栏信息等);
2)将解析得到的图像信息或底层图形数据,重建为精确的矢量几何图元(直线、圆弧、圆、多段线、样条曲线等),并识别图纸中的图层信息、线型、颜色等属性;
3)将重建后的矢量几何与属性信息,完整、准确地输出为标准DXF文件格式,确保输出文件在主流CAD软件(如AutoCAD 2007-2025)中可正常打开、编辑,且与提供的对应测试集CAD文件在几何形状与图层结构上保持一致。
三:功能需求:
(1)PDF图纸解析能力(前置要求)
系统应能原生读取并解析PDF格式的模具图纸,准确提取页面中的图形绘制指令、文本内容及图像数据。需支持解析矢量图形(由PDF绘制命令构成)。
(2)矢量化重建
1)将解析得到的图形数据重建为精确的矢量图元。对于PDF,应直接从绘图命令提取几何信息。
2)重建结果需准确区分不同类型的图元(直线、圆弧、圆、多段线、样条曲线等),并保留其几何精度。
3)识别并还原图纸中的图层信息。若源PDF包含图层(OCG)信息,则需对应重建;若无明确图层信息,则无需处理。
4)识别并还原文字内容及其位置、字体、字号等属性,确保文本信息准确无误。
(3)CAD格式输出
1)将重建后的矢量图元、图层、文字等完整输出为标准DXF文件(支持AutoCAD 2007-2025版本)。
2)同时,输出文件需保留原始图纸的几何形状、图层结构、颜色、线型、文字样式等属性,不得进行不可逆的简化或转换。
3)输出文件应在主流CAD软件中可正常打开、编辑,且视觉呈现与原始PDF图纸保持一致、尺寸大小与图纸实际标注一致(需结合图纸比例信息)。
四:验收标准:
1)检测精度:2.1.2.在甲方提供的PDF模具图纸及对应测试集CAD文件中:
不可有几何图元位置误差。
图元类型识别准确率 ≥ 99%。
矢量化重建准确率 ≥ 99%。
图层归属准确率 ≥ 99%(针对无图层信息的PDF自动归类)。
2)处理效率:单份图纸(典型复杂度,如A3幅面)全流程处理耗时 ≤ 10秒;40份图纸总处理时间(含文件I/O)≤ 6分48秒(测试环境:Intel Core i7 / 16GB RAM / SSD)。
3)兼容性:支持 Windows 10/11 操作系统;兼容主流显卡驱动。
4)稳定性:连续运行 72 小时无内存泄漏或崩溃;对损坏的 CAD 文件应弹出友好提示而非程序异常退出。
5)安全性:所有图纸数据仅在本地处理,不得联网传输;操作日志记录检测时间、文件名、问题统计,保留 ≥180 天。
6)开发语言与框架:使用Python 3.8或者在此之上的其他Python版本,结合常用的工具库实现。
7)PDF解析:禁止使用非授权的PDF解析SDK,必须使用开源合规库。 CAD输出:必须使用经过授权的商业级或开源合规的CAD生成库(如ezdxf),确保输出文件的标准化与兼容性。
8)接口规范:输入是PDF文件,输出是CAD的dxf文件。
9)代码质量要求:代码注释率 ≥ 25%,关键算法需附原理说明。
10)需提供项目源码
竞标人数:0人 剩余竞标席位:20人