↓
Skip to main content
SemAI 论文智读
大模型
人工智能研究
数字治理研究
数据生产要素研究
订阅
大模型
人工智能研究
数字治理研究
数据生产要素研究
订阅
神经语言模型
从大量文本数据中提取代表性子集以训练预训练语言模型
2022-01-01
·
1889 words
·
4 mins
研究发现,通过从大规模数据集中提取代表性子集,可以在减少数据量的同时保持90%的性能水平。