OpenAI 的洛根·基尔帕特里克,负责开发者关系,称新的 Instruct 模型为过渡到3.5 Turbo的临时解决方案。他表示,这并非“长期解决方案”。
正在使用精调模型的客户需要基于新的模型版本进行重新调整。GPT-3.5 可以使用精细调整功能,GPT-4 预计将在今年晚些时候发布。
Instruct 模型是 ChatGPT 突破的基础
Instruct 模型是大型语言模型,通过人类反馈(RLHF)进行精炼处理,这是在对大量数据进行预训练之后的步骤。在此过程中,人们评估模型对用户提供的提示的反应,并改进它以达到目标结果,然后再用它来进一步训练模型。
因此,Instruct 模型能够更好地理解和回应人类的查询,如预期那样,犯的错误更少,传播的有害内容也更少。OpenAI 的测试表明,人们更喜欢拥有13亿参数的 InstructGPT 模型,而不是拥有1750亿参数的 GPT 模型,即使它的大小只有后者的1/100。
相关文章
猜你喜欢