1. 小爬蟲康熙字典 API(非官方)
- 🔗 網址(GitHub): https://github.com/justinmeiners/kangxi
- 📦 格式:JSON
- ✅ 功能:
- 查詢單字的部首、筆劃、解釋
- 支援繁體字查詢
- 💡 適合自架內部查詢伺服器或搭配 MongoDB 使用
2. 中華民國教育部《異體字字典》+《字統網》
- 🔗 字統網: https://dict.variants.moe.edu.tw/
- 🔧 雖無正式 API,但可透過 Scraping 或套接模擬查詢
- ✅ 功能:
- 查繁簡轉換(包含異體字、俗體)
- 字形結構(可解析部件與演變)
3. 汉典(zdic.net)API 類功能
- 🔗 https://www.zdic.net/
- 📛 無官方 API,但有網頁結構穩定
- 📦 可用
requests + BeautifulSoup實作簡單爬蟲 - 📘 包含康熙字典、說文解字、古籍出處等資料
4. 萌典 API(支援台語+字典)
- 🔗 API 文件: https://github.com/g0v/moedict-webkit
- 🔧 JSON 查詢:https://www.moedict.tw/膏.json
- ✅ 功能:
- 查華語、台語、英語、漢字來源
- 回傳詞義、音讀(支援臺羅)
- 可作為甘字典側資料補充
🧮 繁簡對照工具推薦
| 工具名稱 | 用途說明 | 備註 |
|---|---|---|
| OpenCC | 開源繁簡轉換引擎 | 支援台灣標準、香港用法、自訂字表 |
| 中研院漢字標準交換表 | 繁簡字+異體字對照表 | 適合做資料前處理或自動對照 |
| 【g0v】異體字典 | https://dict.variants.moe.edu.tw/ | 可查同源字、簡化字、正字 |
需要的話我可以幫你快速寫一個 Python 查詢範例,整合:
- 康熙 JSON API
- OpenCC 繁簡轉換
- 台語音讀補充(來自萌典)
你想先查哪一個字作為測試?
You said:
1
ChatGPT said:
太好了,我們以「一」這個字作為測試案例,來展示如何查詢與比對《康熙字典》、繁簡轉換與台語讀音的資料。以下是開發計畫的 第一階段查詢模組設計與實作示範:
📦 測試字:「一」
🔍 查詢來源整合結果:
| 項目 | 資料來源 | 查詢結果範例 |
|---|---|---|
| 康熙字典 | Kangxi JSON API | 【子集中】一部;解釋:「陽爻也。初也。數之始也。物之端也…」 |
| 繁簡對應 | OpenCC / 交換表 | 一(繁簡同形) |
| 異體字 | 字統網 / 萌典 | 壹(會計大寫);𠬝(古字) |
| 台語發音 | 萌典 API | 臺羅拼音:it;音標:/it˥/ |
| 甘字典備註(自建) | 用戶自註解模組 | 初一代表開端,亦為陰陽轉化基礎;閩南語使用頻繁,如「一暝大一寸」 |
🛠️ 開發模組設計提案
Step 1: 設計 .env 設定內容
dotenvCopyEditKANGXI_JSON_PATH=./kangxi.json
OPENCC_CONFIG=t2s.json
MOEDICT_API=https://www.moedict.tw/
Step 2: Python 查詢整合模組簡化版
pythonCopyEditimport json, requests
from opencc import OpenCC
cc = OpenCC('t2s')
def query_kangxi(char):
with open('./kangxi.json', encoding='utf-8') as f:
data = json.load(f)
return data.get(char, "未收錄")
def query_moedict(char):
url = f"https://www.moedict.tw/{char}.json"
r = requests.get(url)
if r.status_code == 200:
return r.json()
else:
return {"error": "查無此字"}
char = "一"
print("《康熙字典》:", query_kangxi(char))
print("繁轉簡:", cc.convert(char))
moe = query_moedict(char)
print("台語讀音:", moe.get('heteronyms', [{}])[0].get('bopomofo', '無資料'))