一、目標
開發一套具備離線能力的閩南語語音識別與合成模組,適用於教育、語料保存、AI 對話與智慧裝置。
二、核心子模組與資料來源
| 子模組 | 說明 | 使用資料來源 |
|---|
| 音韻系統 | 建立語音對應表(聲母、韻母、聲調) | 《臺灣閩南語常用詞辭典》、台灣語文研究中心語音資料 |
| 聲調標記與輸入法對應 | 客製羅馬拼音或漢字注音輸入規則 | 教育部閩南語拼音系統 |
| 詞彙庫建構 | 收錄常用詞、歇後語、俚語 | 甘為霖《廈門音新字典》、教育部辭典 |
| 字形與異體分析 | 支援古字、俗字輸出、變體比對 | 《康熙字典》、《異體字字典》、CHISE Project |
| 詞性與語法模型 | 用於語音轉換與語義理解 | 台語文語料庫(例:中央研究院語料)、台語新聞文本 |
| 語音合成 | 自建 TTS 模型,支援女聲與男聲,含情緒語調 | Mozilla TTS、ESPnet、聲音樣本庫 |
| 語音辨識 | 開發 ASR 模型,適用於多腔調輸入 | Whisper 精調版、Kaldi、CommonVoice 台語資料集 |
三、研究階段與時間表(建議)
| 階段 | 預計時間 | 內容 |
|---|
| 第 1 階段 | 第 1–2 月 | 系統規劃、語音語料蒐集、整合甘字典與康熙字典條目 |
| 第 2 階段 | 第 3–4 月 | 初步建構 ASR + TTS 雙模型架構,處理標記格式 |
| 第 3 階段 | 第 5–6 月 | 精調語音合成與辨識,整合語法與音韻處理模組 |
| 第 4 階段 | 第 7–8 月 | 離線封裝與前端互動介面開發,測試多腔調辨識能力 |
| 第 5 階段 | 第 9–10 月 | 教育與展示用途測試、API 文件編寫、實地場景實驗 |