PDF 解析格式化输出 API 数据接口
支持输出 TEXT HTML XML TAG,多种格式输出,超精准识别率。

1. 产品功能
- 通用的识别接口, 支持标准 PDF 文件解析;
- 多种格式输出,支持 TEXT HTML XML TAG;
- HTML 包含完美排版格式;
- 基于机器学习不断提高的识别率;
- 1M 文件毫秒级识别性能;
- 数据持续更新与维护;
- 全接口支持 HTTPS(TLS v1.0 / v1.1 / v1.2 / v1.3);
- 全面兼容 Apple ATS;
- 全国多节点 CDN 部署;
- 接口极速响应,多台服务器构建 API 接口负载均衡;
- 接口调用状态与状态监控
2. API 文档
接口详情: https://www.gugudata.com/api/details/pdf2format
接口地址: https://api.gugudata.com/imagerecognition/pdf2format?appkey=&type=
返回格式: application/json; charset=utf-8
请求方式: POST
请求协议: HTTPS
请求示例: https://api.gugudata.com/imagerecognition/pdf2format?appkey=&type=
数据预览: https://www.gugudata.com/preview/pdf2format
接口测试: https://api.gugudata.com/imagerecognition/pdf2format/demo
3. 请求参数
| 参数名 |
参数类型 |
是否必须 |
默认值 |
备注 |
| appkey |
string |
是 |
YOUR_APPKEY |
付费后获取的 APPKEY |
| type |
string |
是 |
YOUR_VALUE |
定义输出格式,可选 text\ |
html\ |
xml\ |
tag |
| pdffile |
file |
是 |
YOUR_VALUE |
文件格式参数,待转换的 PDF 文件 |
4. 返回参数
| 参数名 |
参数类型 |
备注 |
| DataStatus.StatusCode |
int |
接口返回状态码 |
| DataStatus.StatusDescription |
string |
接口返回状态说明 |
| DataStatus.ResponseDateTime |
string |
接口数据返回时间 |
| DataStatus.DataTotalCount |
int |
此条件下的总数据量,一般用于分页计算 |
| Data.Data |
string |
接口解析 PDF 返回数据,格式由 type 参数决定 |
–EOF–
转载须以超链接形式标明文章原始出处和作者信息
