漢字音典(MCPDict)是一個面向語言、方言與漢字音研究愛好者的資料整理與查詢項目,收錄各類語言(方言)的漢字讀音及相關釋義,並提供便捷的檢索工具。
目前,漢字音典已收錄近三千個語言/方言點,內容涵蓋歷史音、漢語方言、民語漢字音、域外方音、戲曲音等多種類型。現階段的主要工作,是持續推進全國各地方言及語言的同音字表的電子化;未來若條件成熟,亦將逐步嘗試詞彙資料的整理與建設。
漢字音典為持續更新中的公開項目,亦歡迎對語言、方言與字表整理有興趣的朋友共同參與,或提出寶貴建議。
漢字音典源自 @王赟 Maigo 開發的「漢字古今中外讀音查詢(MCPDict)」程序。原項目始於 V1.0(2014.04.02),至 V3.0(2016.05.03) 後停止更新。
其後,@osfans 發起漢字音典項目,並在 2022.05.16 停更後再次恢復更新。此後,亦有眾多方言愛好者持續參與,為本項目的建設與發展貢獻力量。
漢字音典目前的字表收錄範圍如下:
收錄內容包括:歷史音、漢語方言、民語漢字音、域外方音、戲曲音等。
收錄來源包括:公開發表的學術論文、書籍資料、愛好者田野調查成果,以及母語者自行製作的字表。
漢字音典所收字表為公開整理項目;如涉及版權疑慮,請及時聯係項目組。若個人提交的字表有正式發表規劃,原則上不予收錄。
漢字音典僅收錄真實存在的語言及韻書;對於構擬的原始語或人造語言,原則上不予收錄。
通過漢字或讀音查詢各方言中的漢字讀音
選擇辭典、註釋,通過釋義反查漢字
根據字音和字形猜漢字
根據字音和相對方位猜方言、地區、分區
具體功能及使用方法可參見程序內「❔幫助」。
漢字音典目前僅提供 Android 版本。
目前唯一官方發佈平臺為 GitHub。
軟件採用 GitHub Actions 自動編譯生成,並不定時更新。
最新版可於 GitHub Releases 下載。
如需介紹相關網頁版或延伸工具,可另列如下:
唯二開發的網頁版(前端、後端):提供字音查詢、長文注音、語言地圖、設定等功能。
不羈開發的方音圖鑑(前端、後端):提供中古音查詢、音位查詢、聲調查詢、單字查詢、分區繪圖、自訂繪圖等功能。
漢字古今中外讀音查詢:可查多種語言中的汉字讀音(包括中古漢語、普通話、粤語、吴語(上海話)、閩南語、朝鲜語、越南語、日語)
OpenCC:提供了漢字繁簡轉換功能
同音字表收錄是漢字音典目前最主要的工作內容,也是項目持續擴充資料庫的核心基礎。内容包括公開資料的電子化以及自行製作的字表。
字表:已收錄近三千種語言(方言)的漢字讀音及釋義,可去QQ羣提供同音字表請求收錄
勘誤:參考字表解析日誌,可去QQ羣、GitHub提出意見與建議
漢字音典建立了自身的分區方案,以利於檢索、整理與歸類。詳見附錄。
漢字讀音数据庫及 Android 版軟件開發:@osfans
檔案維護:@Resound 等
分區維護:見附錄
字表製作:由衆人共同參與;目前貢獻較多者為 @DaiDzao、@Resound
漢字音典的語言檔案由 @Resound 建立,負責項目中的語言資料管理。其主要內容包括:語言名稱及簡稱、提交文件名稱、語言行政區劃及地理坐標、聲調(調類、調名、調值)、參考文獻、錄入人、維護人、説明、多種分區信息等。目前檔案僅對參與字表製作的群友開放。
漢字音典預設使用繁體字顯示,但搜尋框可自動識別簡體與繁體輸入。
不同字表在繁體、簡體及本字使用上的差異,仍有待進一步整理與優化。
漢字:已收錄□(合音字、本字不明、有音無字)、〇(“星”或“零”)、統一碼17.0的全部漢字(不含部首及兼容區)共101998字
漢字音典大部分字表由 OCR 輔助並經人工校對整理而成,雖已盡力核校,仍難以完全避免錯誤。使用音典資料時,請務必自行查閱原始字表或資料出處,不宜直接引用漢字音典作為唯一依據。漢字音典僅為便於快速查閱之工具;凡因未經核實而產生之誤解或錯誤,均與本項目無關。
漢字音典中大部分字表由愛好者獨立製作;如某方言點的漢字讀音存在問題,歡迎向漢字音典項目組或相應字表製作者反映。
漢字音典提供分區方案,以便搜尋、整理與歸類。目前主要提供三種分區方案,分別為:地圖集二分區、音典分區、陳邡分區。
其中:
地圖集二分區為預設分區,基本依據《中國語言地圖集 第2版 汉語方言卷(2012)》的相關文字說明劃分;對於地圖集中未明確提及的方言,則按相近標準歸類。
音典分區為漢字音典自行建立之分區方案。
陳邡分區為私人分區方案,本項目原則上不作說明。
未來亦計畫推出自主分區功能,以便使用者依需求進行整理與檢索。
需要說明的是,漢字音典分區中的方言部分,原則上反映方言之系屬關係;但由於譜系關係與實際分區在細節上難以完全一致,加之出於管理成本與搜尋便利的考量,部分分區並未完全遵循譜系分類原則。又因各方言區之劃分者不同,分區顆粒度亦不盡一致,尚請理解。
另需特別說明:漢字音典分區僅為對方言重新劃分的一種實踐方式,與《中國語言地圖集》並無隸屬或權威對應關係。除相應分區劃分者外,任何人均不得代表漢字音典或分區制定者對該分區作權威性解釋。
| 編號 | 分區 |
|---|---|
| A | 歷史音 |
| AX | 現代標準漢語 |
| B | 華北 |
| C | 西北 |
| D | 藍青 |
| E | 中上江 |
| F | 下江 |
| G | 兩浙 |
| H | 浙南 |
| I | 湘贛 |
| J | 嶺東/廣中 |
| K | 嶺南/嶺西 |
| L | 閩 |
| M | 湘南 |
| N | 道州 |
| O | 鄉話 |
| P | 白語 |
| Q | 蔡家話 |
| X | 民語漢字音 |
| Y | 域外方音 |
| Z | 戲劇 |
具體分區介紹目前主要涉及二級分區;三級分區僅供參考。
維護:@茉莉
參考資料:MCPDict-華北分區20250921
C1關隴:參照《中國語言地圖集 第2版 汉語方言卷(2012)》B1-6 官話之六 中原官話B。
C2甘肅:參照《中國語言地圖集 第2版 汉語方言卷(2012)》B1-8 官話之八 蘭銀官話。
C3-C9:@開水師
參考資料:晋語分區圖——Made by Lieo-Hae-Yan
維護:@Resound等
説明:該部分爭議最多,并不符合譜系分類,但單獨分開占據極多序號,且非常不便於搜索,遂歸爲一類。
維護:@楚天方音部 @Kyuuri哒
參考資料:https://www.zhihu.com/question/1926941809407428195
維護:@Resound
F1-F4:共識
F5通泰:參考《通泰方言音韻研究》(顧黔,2001)。
維護:@正心修身
參考資料:音典分區兩浙(部份)分區標準 - 知乎
維護:@無歸䖳
維護:@冰糖橙、@Pekkhak
參考資料:音典分区湖南地区分类标准笔记 - 知乎
維護:@Resound、@ Kwíngiem Chan等
參考資料:闽西语扩散简图(稿) - 知乎贛粵本地話家族分佈圖 - 知乎
維護:@ Kwíngiem Chan
參考資料:泛粵語分區方案與語言特徵(2024)(先行導播)-知乎
L1-L6維護:@syami
參考資料:https://www.zhihu.com/question/529981276/answer/2856222824
L7、L7Z閩西 維護:@tom zzy
參考資料:闽西语谱系树 - 知乎闽西语扩散简图(稿) - 知乎
維護:@Resound