要点总结 #
乡村振兴战略对农业技术推广提出了新要求,传统推广方式存在供需矛盾。 本研究以草莓种植为例,基于大语言模型技术,构建了果蔬农技知识智能问答系统,旨在为种植户提供高质量、个性化的农业知识服务。通过分析草莓种植户的需求,将农技知识划分为多个主题,并结合机器自动标注和人工标注构建高质量训练语料。
研究对比了四种大语言模型的性能,最终选择 ChatGLM 作为基础模型。 通过微调和检索增强生成技术,显著降低了模型的幻觉率,提升了语义相似度。实验结果表明,ChatGLM 在命名实体识别和知识问答任务中表现最优,能够有效缓解大模型幻觉问题,提升农业知识问答的准确性和实用性。
关键要点 #
论文重要性 #
本研究通过大语言模型技术,显著提升了农业知识服务的精准性和效率,解决了传统农技推广中的供需矛盾。 随着大模型技术的不断发展,其在多模态知识处理和决策制定方面的潜力将进一步释放。然而,大模型在性能稳定性和具体场景应用方面仍需进一步研究。未来,该技术有望在更多农业领域得到广泛应用,推动农业现代化进程。
图表分析 #
果蔬农技知识需求调研种植户的区域分布 #
🔼 该图为柱状图,展示了参与果蔬农技知识需求调研的种植户的区域分布情况。横轴代表北京市的各个郊区,纵轴代表各区域参与调研的种植户人数。从图中可以看出,昌平区的受调研人数最多,接近40人,其次是通州区和顺义区,分别有约21人和19人。平谷区、大兴区和密云区的受调研人数在10-15人之间。房山、海淀、延庆和丰台的受调研人数在10人以下,而怀柔和朝阳区的受调研人数最少,均在5-10人之间。这张图直观地显示了调研样本的分布,表明调研主要覆盖了北京市郊区的主要农业种植区域,特别是昌平、通州和顺义等地区。这有助于了解不同区域种植户的农技需求特点,并为系统开发提供数据基础。总体来说,调研样本的区域分布相对广泛,但不同区域的样本量存在一定差异,这可能需要研究者在分析数据时加以考虑。
更多图表分析
果蔬农技知识智能问答系统框架 #
🔼 该图展示了一个基于大语言模型的果蔬农技知识智能问答系统的总体框架。整个系统构建的核心目标是为农业生产者提供便捷、高效的农业技术知识服务,并解决当前农业技术推广中存在的“供需矛盾突出”的问题。系统流程自下而上,首先,系统依据果蔬农技知识需求分析,识别出农业生产者在实际生产中遇到的问题和对知识的需求。在此基础上,将农技知识划分为不同的专题,如生产基本知识、品种筛选、套种知识、病虫害诊断与防治等,这些专题构成了知识体系的基础。然后,系统利用高质量的小样本标注数据,结合fine-tuning和p-tuning方法,对通用预训练大模型进行微调,使其能够更好地适应农业领域的特定任务。在模型选择方面,研究选择了ChatGLM、Llama、Baichuan等多个预训练大模型作为候选。经过微调的模型,再经过答案生成模块,通过强化学习和迭代训练进行反馈优化。最终,系统输出可用于农业知识问答的农业知识问答大模型。此模型具有语义分析、上下文关联和生成能力,能够为农业生产者提供高精度、无歧义的有效知识,有效降低种植户获取高质量有效知识的时间成本。此系统的构建目的在于创新农技知识服务模式,优化农业知识推广,最终引导更多的种植户实现农业技术创新和转型。

不同主题下大模型优化前后幻觉率对比 #
🔼 该图为柱状图,展示了不同知识主题下,四个大语言模型(Baichuan、Llama、ChatGPT 和 ChatGLM)在“微调+优化”前后的幻觉率对比。横轴代表不同的模型,纵轴代表幻觉率(%)。图中有六个子图,分别对应六个不同的知识主题,分别是:(a)生产基本知识,(b)品种筛选,(c)套种知识,(d)虫害诊断与防治,(e)病害诊断与防治,和 (f)药害诊断与防治。每个子图中的蓝色柱子代表模型“微调+优化”前的幻觉率,橙色柱子代表“微调+优化”后的幻觉率。从图中可以看出,在所有知识主题下,所有模型的“微调+优化”后,幻觉率都有显著下降,这表明所使用的微调和优化策略能够有效地减少大模型在回答问题时产生不正确或不相关信息的情况。在不同的知识主题中,药害诊断与防治的幻觉率下降最为显著,这可能是因为该主题的知识相对结构化,并且有更多的训练数据。具体来说,优化前,所有模型的幻觉率普遍较高,大多在30%到50%之间,表明模型容易产生幻觉。优化后,幻觉率明显降低,大部分降到了10%到20%之间,其中ChatGLM模型在优化后的幻觉率通常是最低的,表明其在所有模型中表现最佳。总而言之,此图清晰地展示了通过“微调+优化”,各种大模型在处理农业知识时,幻觉问题得到了显著的缓解,模型的可靠性和准确性得到了大幅提升。

大模型微调前后语义相似度对比 #
🔼 该图展示了四个不同的大型语言模型(Baichuan, Llama, ChatGPT, ChatGLM)在进行微调和优化前后,其在病害诊断与防治这一知识主题下的语义相似度变化。图中蓝色柱状图代表微调和优化之前的语义相似度得分,而橙色柱状图则代表经过微调和优化后的语义相似度得分。语义相似度通过比较模型预测答案和语料库中提供的标准答案之间的相似程度来衡量。从图中可以明显看出,所有四个模型的语义相似度在微调和优化后均有显著提升。具体而言,Baichuan模型的语义相似度从大约57%提升到了大约75%,Llama模型从大约60%提升到了大约81%,ChatGPT模型从大约61%提升到了大约79%,而ChatGLM模型的提升最为显著,从大约66%提升到了大约83%。这些数据表明,通过微调和优化,模型生成的答案与标准答案之间的语义相关性增强,说明了微调和优化策略在提高大模型回答质量方面的有效性。其中,ChatGLM模型表现最佳,微调和优化后,语义相似度最高,表明该模型更能够理解和回应与病害诊断和防治相关的问题。这些发现对进一步优化基于大型语言模型的农业知识问答系统具有指导意义,有助于提高系统向用户提供的答案的准确性和相关性。

不同知识主题下大模型幻觉率 #
🔼 该图展示了在不同知识主题下,微调和优化前后,大型语言模型(LLM)的幻觉率对比分析。具体来说,它比较了Baichuan、ChatGLM、Llama和ChatGPT这四种模型在六个不同的农业知识主题(生产基本知识、品种筛选、套种知识、虫害诊断与防治、病害诊断与防治、药害诊断与防治)上的表现。每个主题都展示了模型在进行微调和优化之前和之后的幻觉率。微调和优化通常包括数据清洗、RAG(检索增强生成)技术等,旨在提高模型生成答案的准确性和事实性,降低模型产生错误或不相关回复的可能性。从图中可以看出,在不同知识主题下,大模型幻觉问题的缓解程度有所不同。例如,药害诊断与防治专题由于其知识点相对明确,且标注语料相对充分,大模型幻觉问题的改善更为显著。此外,相同“微调+优化”方式下,不同大模型对大模型幻觉问题的缓解程度也有所不同,例如,在病害诊断与防治主题下,ChatGPT的幻觉率降低约10.9%,而ChatGLM则降低了高达43.5%,说明不同模型对优化策略的响应程度存在差异。总体而言,经过“微调+优化”后,所有模型的幻觉率均有显著降低,大约降低了10%至40%,这表明所采用的优化策略有效缓解了大型语言模型的幻觉问题,提高了模型回复的质量。

深度解读 #
大模型优化 #
本论文在大模型优化方面展现了显著的创新性,主要体现在对预训练大模型的微调和检索增强生成(RAG)技术的应用上。传统的大模型在生成内容时存在幻觉问题,即生成的答案可能不符合事实或与问题不相关。为了解决这一问题,论文采用了数据优化和RAG技术,通过构建外部知识库并结合检索模型,显著降低了幻觉率。具体来说,RAG技术通过将大模型与外部知识源结合,不仅提高了专业知识的广度和深度,还保持了知识的时效性。这种策略的优势在于,它能够有效缓解大模型生成不准确、不相关或虚构内容的问题,从而显著提升模型生成答案的质量和有效性。然而,这种优化方法也存在一定的局限性,例如对外部知识库的依赖和数据安全性的挑战,这需要在未来的研究中进一步改进。此外,这种方法的应用前景十分广阔,可以推广到其他领域,如医疗、金融等,为相关研究提供新的思路和工具。
农技知识问答 #
论文在农技知识问答方面提出了基于大模型的智能问答系统,旨在为种植户提供高精度、无歧义的农业知识答案。传统的农技推广方式存在供需矛盾,无法满足种植户的个性化需求。为了解决这一问题,论文采用了基于大模型的问答系统,通过微调和优化,显著提升了问答系统的性能。具体来说,系统通过对比多种大模型(如ChatGLM、Baichuan等),选择了性能最优的模型,并结合RAG技术,进一步提升了问答的准确性和相关性。这种方法的优势在于,它能够有效降低种植户获取高质量知识的时间成本,并引导更多的种植户实现农业技术创新和转型。然而,该系统仍面临性能不稳定的问题,特别是在处理复杂问题时,模型的生成质量可能下降。未来的研究可以进一步优化模型的生成能力,特别是在多轮对话和复杂问题处理方面。
命名实体识别 #
论文在命名实体识别任务中展示了显著的性能提升,特别是在农业领域的知识实体识别方面。传统的命名实体识别方法依赖专家知识和规则,无法适应新领域和新数据集的扩展。为了解决这一问题,论文采用了基于深度学习的命名实体识别方法,并结合大模型的微调技术,显著提升了识别的精准率和召回率。具体来说,论文通过Lora微调方法,仅对部分重要参数进行微调,从而加速了模型训练并提高了性能。这种方法的优势在于,它能够有效利用大模型的泛化能力,适应多种下游任务,特别是在农业领域的知识实体识别中表现出色。然而,这种方法也存在一定的局限性,例如对标注语料的数量和质量有较高要求,这需要在未来的研究中进一步改进。此外,这种方法的应用前景十分广阔,可以推广到其他领域的命名实体识别任务中,为相关研究提供新的思路和工具。
未来研究方向 #
论文末尾指出了几个值得进一步研究的方向,其中最值得关注的是大模型在农业领域的应用优化。当前的大模型在生成内容时仍存在性能不稳定的问题,特别是在处理复杂问题时,模型的生成质量可能下降。未来的研究可以从以下几个方面入手:首先,可以尝试进一步优化大模型的微调方法,特别是在多轮对话和复杂问题处理方面;其次,可以探索结合多模态数据(如图像、视频等)的问答系统,这将为农业知识问答提供更丰富的上下文信息;最后,可以结合更多的外部知识库,进一步提高问答系统的精度和效率。这些研究方向的探索将对农业技术推广领域的发展产生深远的影响。同时,需要注意的是,未来的研究需要克服数据安全性和模型性能不稳定等挑战。
农技推广创新 #
论文在农技推广创新方面提出了基于大模型的智能问答系统,旨在通过技术创新优化农业知识的推广方式。传统的农技推广方式存在供需矛盾,无法满足种植户的个性化需求。为了解决这一问题,论文提出了基于大模型的智能问答系统,通过微调和优化,显著提升了问答系统的性能。具体来说,系统通过对比多种大模型(如ChatGLM、Baichuan等),选择了性能最优的模型,并结合RAG技术,进一步提升了问答的准确性和相关性。这种方法的优势在于,它能够有效降低种植户获取高质量知识的时间成本,并引导更多的种植户实现农业技术创新和转型。然而,该系统仍面临性能不稳定的问题,特别是在处理复杂问题时,模型的生成质量可能下降。未来的研究可以进一步优化模型的生成能力,特别是在多轮对话和复杂问题处理方面。
完整论文 #











