閩南語語音模組開發計畫表（初稿）

開發一套具備離線能力的閩南語語音識別與合成模組，適用於教育、語料保存、AI 對話與智慧裝置。

子模組	說明	使用資料來源
音韻系統	建立語音對應表（聲母、韻母、聲調）	《臺灣閩南語常用詞辭典》、台灣語文研究中心語音資料
聲調標記與輸入法對應	客製羅馬拼音或漢字注音輸入規則	教育部閩南語拼音系統
詞彙庫建構	收錄常用詞、歇後語、俚語	甘為霖《廈門音新字典》、教育部辭典
字形與異體分析	支援古字、俗字輸出、變體比對	《康熙字典》、《異體字字典》、CHISE Project
詞性與語法模型	用於語音轉換與語義理解	台語文語料庫（例：中央研究院語料）、台語新聞文本
語音合成	自建 TTS 模型，支援女聲與男聲，含情緒語調	Mozilla TTS、ESPnet、聲音樣本庫
語音辨識	開發 ASR 模型，適用於多腔調輸入	Whisper 精調版、Kaldi、CommonVoice 台語資料集