Skip to main content

基于人类反馈的强化学习

ChatGPT给语言大模型带来的启示和多模态大模型新的发展思路
·3777 words·8 mins
ChatGPT通过指令微调和人类反馈强化学习,为大语言模型和多模态大模型的发展提供了新的技术路径。