語料庫

信息技术名词,大批量电子化自然语言样本所构成的集合

語料庫一詞在語言學上意指大量的文本,通常經過整理,具有既定格式與標記。

根據語料庫的特徵,可以分為單語語料庫、雙語語料庫、平行語料庫等,根據語料的來源,可以分為書面語語料庫、口語語料庫、作文語料庫、學習者語料庫、古文書語料庫等。[1]

語料庫列表 編輯

多語 編輯

英語 編輯

漢語 編輯

繁體中文 編輯

簡體中文 編輯

日語 編輯

研究機構 編輯

外部連結 編輯

參考文獻 編輯

  1. ^ 狐狸等間隔. 日语语料库超入门. 微信公眾平台. [2022-12-20]. (原始內容存檔於2022-12-20).