本倉庫收集粵語 NLP 資源,倉庫內容:
- Facebook 政府新聞網 (govnews.hk) (Latest: 2020-01-07 20:22:31 PST, crawled with rugantio/fbcrawl).
名 Name | 描述 Description | 大細 Size | 許可證 Licence | 連結 Link |
---|---|---|---|---|
Hong Kong Cantonese Corpus (HKCanCor) 香港粵語語料庫 |
Hong Kong Cantonese Corpus (HKCanCor) 香港粵語語料庫 fcbond/hkcancor |
|||
香港二十世紀中期語料庫 | 《香港二十世紀中期語料庫》 《香港二十世紀中期語料庫》打包器 |
|||
Malaysia Cantonese Corpus (MYCanCor) 馬來西亞粵語語料庫 | liesenf/MYCanCor |
名 Name | 描述 Description | 許可證 Licence | 連結 Link |
---|---|---|---|
Cifu | A frequency lexicon for Hong Kong Cantonese | GPL-3.0 | gwinterstein/Cifu |
ToJyutping | 粵語拼音自動標註工具 Cantonese Pronunciation Automatic Labeling Tool | MIT | ToJyutping |
PyCantonese | Cantonese Linguistics and NLP in Python | MIT | jacksonlee/pycantonese |
- 粵文維基百科 Dump
- 粵語/廣東話參考資料 Reference Materials for Yue / Cantonese: wordshk/yue_references
- 粵語 NLP 討論谷:https://t.me/cantonesenlp