Skip to main content

视觉问答

多模态大语言模型的局限性是什么?通过提示探测深入探讨多模态大语言模型
·4170 words·9 mins
本文通过提示探测框架揭示了多模态大语言模型在视觉、文本和额外知识提示下的局限性,发现模型对输入内容的理解存在显著偏差。