本文总阅读量:  次 | 文章总字数: 1,193 字

网页 URL 转 Markdown API 接口

接口详情官网地址: https://www.gugudata.com/api/details/url2markdown

网页 URL 转 Markdown API 将任意网页 URL 转换为 Markdown 格式文本,网站工具、markdown等关键词场景常会用到,适合用于站点内容抽取与网页分析、SEO 检查与页面结构处理与网页自动化采集与结构化输出等业务场景,方便开发者直接在应用、脚本或数据流程中接入。

gugudata_api_cover

1. 产品功能

  • 支持任意网页 URL 转换为 Markdown 格式(注意:无法处理具有反爬机制或不合规的网页);
  • 智能提取网页主要内容,过滤无关元素;
  • 保持原有文本结构和格式;
  • 支持图片、链接等元素的 Markdown 转换;
  • 全接口支持 HTTPS(TLS v1.0 / v1.1 / v1.2 / v1.3);
  • 全面兼容 Apple ATS;
  • 全国多节点 CDN 部署;
  • 接口极速响应,多台服务器构建 API 接口负载均衡;

2. API 文档

接口地址: https://api.gugudata.com/websitetools/url2markdown

返回格式: application/json; charset=utf-8

请求方式: GET

请求协议: HTTPS

请求示例: https://api.gugudata.com/websitetools/url2markdown?appkey=YOUR_APPKEY&url=YOUR_VALUE

数据预览: https://www.gugudata.com/preview/url2markdown

接口测试: https://api.gugudata.com/websitetools/url2markdown/demo

3. 请求参数

参数名 参数类型 是否必须 默认值 备注
appkey string YOUR_APPKEY 付费后获取的 APPKEY
url string YOUR_VALUE 需要转换的网页 URL 地址,必须是有效的 HTTP 或 HTTPS 链接

4. 返回参数

参数名 参数类型 备注
DataStatus.StatusCode int 接口返回状态码
DataStatus.StatusDescription string 接口返回状态说明
DataStatus.ResponseDateTime string 接口数据返回时间
DataStatus.DataTotalCount int 此条件下的总数据量,一般用于分页计算
Data string 网页转换后的 Markdown 格式内容

5. 错误码说明

状态码 错误说明 备注
100 正常返回 -
101 参数错误 URL 参数为空或格式错误
102 请求频率受限 每秒请求不能超过 100 次
103 账号欠费 -
104 APPKEY 错误 请检查传递的 APPKEY 是否为开发者中心获取到的值
110 接口响应错误 网页无法访问或转换失败

6. 适用场景

  • 适合用于站点内容抽取与网页分析,快速补齐产品侧需要的 网页 URL 转 Markdown 数据能力。
  • 适合用于SEO 检查与页面结构处理,减少手工整理、清洗与重复开发成本。
  • 适合用于网页自动化采集与结构化输出,将接口结果直接接入后台系统、数据任务或内容处理流程。

7. 相关接口

  • 可搭配使用:获取任意站点标题与图标,适合补充同类场景的接口能力。
  • 可搭配使用:域名 Whois 查询,适合补充同类场景的接口能力。
  • 可搭配使用:网页可读内容抽取,适合补充同类场景的接口能力。

EOF

转载须以超链接形式标明文章原始出处和作者信息

微信公众号二维码