📚 康熙字典 API 與查詢資源

1. 小爬蟲康熙字典 API(非官方)

  • 🔗 網址(GitHub): https://github.com/justinmeiners/kangxi
  • 📦 格式:JSON
  • ✅ 功能:
    • 查詢單字的部首、筆劃、解釋
    • 支援繁體字查詢
  • 💡 適合自架內部查詢伺服器或搭配 MongoDB 使用

2. 中華民國教育部《異體字字典》+《字統網》

  • 🔗 字統網: https://dict.variants.moe.edu.tw/
  • 🔧 雖無正式 API,但可透過 Scraping 或套接模擬查詢
  • ✅ 功能:
    • 查繁簡轉換(包含異體字、俗體)
    • 字形結構(可解析部件與演變)

3. 汉典(zdic.net)API 類功能

  • 🔗 https://www.zdic.net/
  • 📛 無官方 API,但有網頁結構穩定
  • 📦 可用 requests + BeautifulSoup 實作簡單爬蟲
  • 📘 包含康熙字典、說文解字、古籍出處等資料

4. 萌典 API(支援台語+字典)


🧮 繁簡對照工具推薦

工具名稱用途說明備註
OpenCC開源繁簡轉換引擎支援台灣標準、香港用法、自訂字表
中研院漢字標準交換表繁簡字+異體字對照表適合做資料前處理或自動對照
【g0v】異體字典https://dict.variants.moe.edu.tw/可查同源字、簡化字、正字

需要的話我可以幫你快速寫一個 Python 查詢範例,整合:

  1. 康熙 JSON API
  2. OpenCC 繁簡轉換
  3. 台語音讀補充(來自萌典)

你想先查哪一個字作為測試?

You said:

1

ChatGPT said:

太好了,我們以「」這個字作為測試案例,來展示如何查詢與比對《康熙字典》、繁簡轉換與台語讀音的資料。以下是開發計畫的 第一階段查詢模組設計與實作示範


📦 測試字:「一」

🔍 查詢來源整合結果:

項目資料來源查詢結果範例
康熙字典Kangxi JSON API【子集中】一部;解釋:「陽爻也。初也。數之始也。物之端也…」
繁簡對應OpenCC / 交換表一(繁簡同形)
異體字字統網 / 萌典壹(會計大寫);𠬝(古字)
台語發音萌典 API臺羅拼音:it;音標:/it˥/
甘字典備註(自建)用戶自註解模組初一代表開端,亦為陰陽轉化基礎;閩南語使用頻繁,如「一暝大一寸」

🛠️ 開發模組設計提案

Step 1: 設計 .env 設定內容

dotenvCopyEditKANGXI_JSON_PATH=./kangxi.json
OPENCC_CONFIG=t2s.json
MOEDICT_API=https://www.moedict.tw/

Step 2: Python 查詢整合模組簡化版

pythonCopyEditimport json, requests
from opencc import OpenCC

cc = OpenCC('t2s')

def query_kangxi(char):
    with open('./kangxi.json', encoding='utf-8') as f:
        data = json.load(f)
    return data.get(char, "未收錄")

def query_moedict(char):
    url = f"https://www.moedict.tw/{char}.json"
    r = requests.get(url)
    if r.status_code == 200:
        return r.json()
    else:
        return {"error": "查無此字"}

char = "一"
print("《康熙字典》:", query_kangxi(char))
print("繁轉簡:", cc.convert(char))
moe = query_moedict(char)
print("台語讀音:", moe.get('heteronyms', [{}])[0].get('bopomofo', '無資料'))