↓Skip to main content

神经语言模型

从大量文本数据中提取代表性子集以训练预训练语言模型

2022-01-01·1889 words·4 mins

研究发现，通过从大规模数据集中提取代表性子集，可以在减少数据量的同时保持90%的性能水平。