漢語中介語語料庫
漢語中介語語料庫由北京語言大學于1992年開始建設。該語料庫立足于漢語教學已收錄1635位外國學生共5774篇成篇成段的漢語作文或練習材料,總字數約353萬,其中1731 篇約104萬字的語料經過斷句、分詞和詞性標注等加工處理。目前該漢語中介語料庫仍處于努力建設過程中,北京語言大學仍然努力于建設全球漢語中介語語料庫,其規模預計達5000萬字,包括筆語語料、口語語料和多模態子庫。筆語語料規模預計達4500萬字,其中2000萬字將加工成為熟語料;口語語料450小時,約合400萬字;多模態語料110小時,約合100萬字。