基于知识的视觉问答
基于思维链的可解释知识推理在基于知识的视觉问答中的应用
·2355 words·5 mins
MuKCoT框架通过多模态知识推理链提升视觉问答任务的解释性和准确性。
候选启发式上下文学习:一种增强医学视觉问答与大型语言模型的新框架
·9368 words·19 mins
本文提出了一种新的框架CH-ICL,通过结合外部知识和大型语言模型,显著提升了医学视觉问答系统的性能。