閩南語語音模組開發計畫表(初稿)

一、目標

開發一套具備離線能力的閩南語語音識別與合成模組,適用於教育、語料保存、AI 對話與智慧裝置。


二、核心子模組與資料來源

子模組說明使用資料來源
音韻系統建立語音對應表(聲母、韻母、聲調)《臺灣閩南語常用詞辭典》、台灣語文研究中心語音資料
聲調標記與輸入法對應客製羅馬拼音或漢字注音輸入規則教育部閩南語拼音系統
詞彙庫建構收錄常用詞、歇後語、俚語甘為霖《廈門音新字典》、教育部辭典
字形與異體分析支援古字、俗字輸出、變體比對《康熙字典》、《異體字字典》、CHISE Project
詞性與語法模型用於語音轉換與語義理解台語文語料庫(例:中央研究院語料)、台語新聞文本
語音合成自建 TTS 模型,支援女聲與男聲,含情緒語調Mozilla TTS、ESPnet、聲音樣本庫
語音辨識開發 ASR 模型,適用於多腔調輸入Whisper 精調版、Kaldi、CommonVoice 台語資料集

三、研究階段與時間表(建議)

階段預計時間內容
第 1 階段第 1–2 月系統規劃、語音語料蒐集、整合甘字典與康熙字典條目
第 2 階段第 3–4 月初步建構 ASR + TTS 雙模型架構,處理標記格式
第 3 階段第 5–6 月精調語音合成與辨識,整合語法與音韻處理模組
第 4 階段第 7–8 月離線封裝與前端互動介面開發,測試多腔調辨識能力
第 5 階段第 9–10 月教育與展示用途測試、API 文件編寫、實地場景實驗