(相關(guān)資料圖)
海天瑞聲今日宣布正式推出中文千萬輪對話語料庫DOTS-NLP-216。據(jù)介紹,該語料庫更加符合中國人表達習(xí)慣的自然對話數(shù)據(jù)集,共計約千萬輪,上億級token,包含正式&非正式風(fēng)格對話,使用偏口語化自然表達,覆蓋工作、生活、校園等場景,及金融、教育、娛樂、體育、汽車、科技等領(lǐng)域。在數(shù)據(jù)集構(gòu)成上,DOTS-NLP-216包含了對真實場景的對話采集,及高度還原真實場景的模擬對話兩種方式。
廣告
X 關(guān)閉
廣告
X 關(guān)閉