语言模型 · SemAI 论文智读

BERTology的模糊性：大型语言模型代表什么？

2023-12-26·9946 words·20 mins

本文探讨了大型语言模型（LLMs）中的语言表示问题，揭示了BERTology领域在解释LLMs时面临的理论模糊性。

Weak-PMLC: 基于极弱监督的大规模多标签政策分类框架

2023-06-24·6282 words·13 mins

Weak-PMLC 提出了一种基于极弱监督的大规模多标签政策分类框架，仅使用类别名称即可生成高质量伪标签，显著提升了政策分类的准确性。

测量和缓解语言模型在滥用语言检测中的偏见

2023-02-07·1799 words·4 mins

该论文提出了一种新的方法来减少预训练语言模型在滥用语言检测中的偏见，同时保持分类性能。

从一到多：使用语言模型模拟人类样本

2022-09-16·9349 words·19 mins

语言模型GPT-3能够模拟人类子群体的复杂态度和行为，为社会科学研究提供了一种新的工具。

基于思维链的可解释知识推理在基于知识的视觉问答中的应用

2022-01-01·2355 words·5 mins

MuKCoT框架通过多模态知识推理链提升视觉问答任务的解释性和准确性。

基于变化分类模型的在线新闻准确性自动监测

2022-01-01·4712 words·10 mins

该论文提出了一种自动化监测在线新闻准确性的新方法，通过分析新闻文章的更新来检测错误修正。

使用预训练语言模型进行政治文本的主题分类

2022-01-01·5196 words·11 mins

本文提出了一种基于预训练语言模型的政治文本主题分类方法，显著优于跨领域分类器，且仅需少量标注数据。