↓Skip to main content

基于人类反馈的强化学习

ChatGPT给语言大模型带来的启示和多模态大模型新的发展思路

2023-01-01·3777 words·8 mins

ChatGPT通过指令微调和人类反馈强化学习，为大语言模型和多模态大模型的发展提供了新的技术路径。