↓
Skip to main content
SemAI 论文智读
大模型
人工智能研究
数字治理研究
数据生产要素研究
订阅
大模型
人工智能研究
数字治理研究
数据生产要素研究
订阅
推理吞吐量
Selfcp: 通过冻结的大型语言模型自身压缩超限提示
2022-01-01
·
4911 words
·
10 mins
SelfCP 利用冻结的大型语言模型自身压缩超长提示,显著降低内存成本并提升推理效率。