> 自媒体 > AI人工智能 > GPT-4全网首个测评来了!逻辑性、创造性,你想知道的我们都测了
GPT-4全网首个测评来了!逻辑性、创造性,你想知道的我们都测了
来源:清博智能
2023-05-10
330
管理

3月15日凌晨1点,OpenAI宣布推出GPT-4,在功能和一致性方面取得了前所未有的成果。(官网链接:https://openai.com/product/GPT-4

【公众号后台回复“GPT-4”可获取OpenAI的英文原版报告论文与中文翻译稿】

除了GPT-4,OpenAI还发布了其开源软件框架Evals—— 一个可以对AI模型进行众包测试的软件框架,可以用来开发和运行评估GPT-4等模型,同时检查其性能。使用Evals,开发人员可以使用数据集生成提示,测量OpenAI模型的生成质量,并比较不同数据集和模型的性能。

测试者正在展示草稿

ChatGPT-3.5:

图为GPT-3.5(绿色头像)与GPT-4(黑色头像)的歌词生成对比

03

GPT的下一站在哪儿

关于GPT-4的下一次革命会往哪去众说纷纭。但GPT-4自己的回答是:

更大的模型容量;

更准确的预测;

更广泛的知识覆盖;

更多语言支持;

更好的创造性;

更好的可解释性和透明度以及结构化数据和知识图谱。

图为GPT-4对自己优化方向的预测

OpenAI自己认为GPT-4仍然有误差,并有一定的风险。其工作人员在推特上发帖称:“GPT4和GPT3.5之间的差异可能不会像普通用户所宣传的那样夸大。”

AI竞争逐渐白热化。谷歌宣布了自己的文本生成模型PaLM的API和新的开发工具,该模型的功能与OpenAI的GPT类似。谷歌也在进一步测试旗下的Bard聊天机器人,以与ChatGPT竞争,并表示将使用底层技术来改进搜索。

同时,GPT-4已被集成在多邻国、Notion等应用中,用户们将很快就能体验到最新版的GPT-4。AI对日常生活、工作、生成的渗透越发可见,我们期待看见未来有更多革命性进展,那会为人类想象力的发挥提供更广阔的空间。

作者:永光 排版:骆伟玲

图片源于Q仔互联网冲浪所得,若有侵权,后台联系,Q仔滑跪删除~

1
点赞
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与华威派无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
凡本网注明 “来源:XXX(非华威派)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。
如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。
QQ:2443165046 邮箱:info@goodmaoning.com
关于作者
轻随风之舞(普通会员)
点击领取今天的签到奖励!
签到排行
1
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索