机器之心报道
编辑:Panda
随着大型语言模型(LLM)技术的日渐成熟,其应用范围正在不断扩大。从智能写作到搜索引擎,LLM 的应用潜力正在一点点被挖掘。
最近,微软亚洲研究院提出可以将 LLM 用于工业控制,而且仅需少量示例样本就能达成优于传统强化学习方法的效果。该研究尝试使用 GPT-4 来控制空气调节系统(HVAC),得到了相当积极的结果。
表 1:GPT-4 使用不同专家演示时的表现
表 3:GPT-4 使用不同类型的注释时的表现
表 5:在 prompt 中实数是否进行舍入的不同情况下,GPT-4 的性能
表 6:PPO 和 GPT 在天气扰动下的表现
相关文章
猜你喜欢