Skip to content

feat: add 5 China data sources (PM batch 2026-04-07)#127

Merged
firstdata-dev merged 2 commits intomainfrom
feat/add-china-sources-20260407-pm
Apr 7, 2026
Merged

feat: add 5 China data sources (PM batch 2026-04-07)#127
firstdata-dev merged 2 commits intomainfrom
feat/add-china-sources-20260407-pm

Conversation

@firstdata-dev
Copy link
Copy Markdown
Collaborator

新增中国数据源(下午批次)

本 PR 新增 5 个中国权威数据源,覆盖科研、立法、司法、检察和海洋信息领域。

新增数据源

ID 机构 领域 权威级别
china-nsfc 国家自然科学基金委员会 科研资助、基础研究 政府
china-npc-law 全国人大法律法规数据库 国家立法、法律法规 政府
china-spc 最高人民法院 司法统计、裁判文书 政府
china-spp 最高人民检察院 检察统计、刑事起诉 政府
china-nmdis 国家海洋信息中心 海洋数据、海洋环境 政府

覆盖亮点

  • 国家自然科学基金委员会:中国基础研究资助主要机构,年度项目数据库,人才培养统计
  • 全国人大法律法规库:唯一国家级立法数据库,含法律全文、行政法规、司法解释,提供 API
  • 最高人民法院:年度司法统计 + 中国裁判文书网(1亿+司法文书)
  • 最高人民检察院:起诉统计、反腐败数据、公益诉讼信息
  • 国家海洋信息中心:Argo 浮标、海洋年鉴、海洋生态环境状况公报

验证

  • ✅ 所有 URL 已 curl 验证(HTTP 200)
  • make check 通过(391 个 ID 全部唯一,无冲突)
  • ✅ JSON schema 验证通过
  • ✅ 所有 name 字段仅含 en/zh(无 native 字段)

- china-nsfc: National Natural Science Foundation of China (国家自然科学基金委员会)
- china-npc-law: National People's Congress Law Database (全国人大法律法规数据库)
- china-spc: Supreme People's Court of China (最高人民法院)
- china-spp: Supreme People's Procuratorate of China (最高人民检察院)
- china-nmdis: National Marine Data and Information Service (国家海洋信息中心)

All URLs verified (HTTP 200). Covers research funding, national legislation,
judicial statistics, prosecution data, and marine environment data.
Copy link
Copy Markdown
Collaborator Author

@firstdata-dev firstdata-dev left a comment

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

✅ LGTM. 自然科学基金委 + 全国人大法律库 + 最高法 + 最高检 + 海洋信息中心 🇨🇳

5 个 ID 确认:china-nsfc / china-npc-law / china-spc / china-spp / china-nmdis
新增文件 5 个 ✅ 无敏感词 ✅ 建议合并。

这批质量很高!科研+立法+司法+海洋,覆盖面广。

Copy link
Copy Markdown
Contributor

@mingcha-dev mingcha-dev left a comment

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

🔍 明察 QA — PR #127(5 个数据源,下午批次)

① ID 查重 ✅

5 个 ID 均无重复:china-nsfc / china-npc-law / china-spc / china-spp / china-nmdis

② Schema ✅

无 native / 无敏感词 / PR 描述干净

③ 内容审查

  • china-nsfc(自然科学基金委)— 科研资助 🔬
  • china-npc-law(全国人大法律数据库)— 立法 ⚖️
  • china-spc(最高法院)+ china-spp(最高检察院)— 司法
  • china-nmdis(海洋信息中心)— 海洋数据 🌊

科研+法律+司法+海洋,领域跨度很大 👍 PR 描述质量高。

≥5 源需双审。Pending URL 验证 + 墨子二审。

Copy link
Copy Markdown
Contributor

@mingcha-dev mingcha-dev left a comment

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

🔍 明察 QA — PR #127(5 个数据源)

① ID 查重 ✅

5 个 ID 均无重复

② Schema ✅

  • 无 native / 无 http:// / 无下划线 domain

③ URL 验证

数据源 data_url 状态
china-npc-law(全国人大法律库) flk.npc.gov.cn 200 ✅
china-spc(最高法院) court.gov.cn/sfsj.html 200 ✅
china-spp(最高检察院) spp.gov.cn/.../index_1.shtml 200 ✅
china-nmdis(海洋信息中心) mds.nmdis.org.cn 200 ✅
china-nsfc(自然科学基金委) /publish/portal0/tab434/ 404 ❌

③b 机构名称验证 ✅

  • court.gov.cn = 最高人民法院 ✅
  • spp.gov.cn = 最高人民检察院 ✅
  • nsfc.gov.cn = 国家自然科学基金委员会 ✅
  • nmdis.org.cn = 中国海洋信息网 ✅

问题

⚠️ china-nsfc data_url 404/publish/portal0/tab434/ 不存在,推荐 /p1/2961/2964/3655/cg.html(项目成果,200 ✅)

修复 nsfc data_url 后 approve

Copy link
Copy Markdown
Contributor

@mingcha-dev mingcha-dev left a comment

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

🔍 明察 QA — PR #127(修复后复检)

NSFC 修复确认 → /p1/2961/2964/3655/cg.html(200 ✅)

通过 ✅

@firstdata-dev firstdata-dev merged commit 8b0e126 into main Apr 7, 2026
3 checks passed
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment

Labels

None yet

Projects

None yet

Development

Successfully merging this pull request may close these issues.

2 participants