Skip to main content

神经语言模型

从大量文本数据中提取代表性子集以训练预训练语言模型
·1889 words·4 mins
研究发现,通过从大规模数据集中提取代表性子集,可以在减少数据量的同时保持90%的性能水平。