> 自媒体 > AI人工智能 > 实测文心一言,与GPT-4差距在哪?
实测文心一言,与GPT-4差距在哪?
来源:新榜
2023-05-04
220
管理

本周无疑是AI爆炸周。

昨晚微软推出了Microsoft 365 Copilot,Office软件全面接入生成式AI功能。

而在刚刚过去的疯狂星期四,“中国版GPT”文心一言也迎来了备受关注的高光时刻。当天 下午2点,百度创始人李彦宏出现在发布会现场,展示了文心一言的使用场景表现。

据悉,3月16日起,首批用户可通过邀请码在文心一言官网体验产品,后续将陆续开放给更多用户。

文心一言:是不及预期,还是值得期待?

“十月怀胎,一朝分娩。”

正式发布文心一言之前,李彦宏用这样一句话概括百度多年来在文心AI系列产品上的布局。2019年3月,百度推出文心ERNIE 1.0以来,期间经历了多次迭代,此次发布的文心一言是在过往产品上的延续与升级。

李彦宏还表示,对文心一言,大家的期望值是要对标ChatGPT,甚至要对标GPT4,这个门槛还是很高的。全球的大厂当中,百度是第一个发布的。 (ChatGPT由OpenAI开发,不隶属于微软,双方为合作伙伴关系)

在产品演示环节,李彦宏分别演示了文心一言在文学创作、商业文案创作、数理推算、中文理解和多模态生成五种使用场景中的表现,比如总结小说《三体》的核心内容,给公司起名、写标语,计算鸡兔同笼数学问题,以及根据文本自动生成图片、视频等。

不过目前图像输入仍属于研究方面预览,没有对C端用户开放。

2.更长的上下文

GPT-4能够处理超过25000个单词的文本 ,允许使用长格式内容创建、扩展对话以及文档搜索和分析等。这意味着用户不用像之前那样分成几段文字来提问,处理长文本更方便了。

比如输入一个蕾哈娜的百科网址,GPT-4可以读取其中的内容并根据要求整合信息,回答出她在超级碗上的表现如何。

此外,相比上一代的GPT-3.5,GPT-4的回答深度和专业性、解决难题的能力等也显著提高。

据官方介绍,在随意的谈话中,GPT-3.5和GPT-4之间的区别可能很微妙。但当任务的复杂性达到足够的阈值时,差异就会出现——GPT-4比GPT-3.5更可靠、更有创意,并且能够处理更细微的指令。

在安全问题上,OpenAI花了6个月的时间使GPT-4更安全、更一致,据内部评估,与GPT-3.5相比,GPT-4响应违规内容请求的可能性降低82%,产生事实响应的可能性高40%。但OpenAI承认,GPT-4仍然不完全可靠,例如会生成有害建议、错误代码或不准确信息,我们在使用时需要谨慎辨别。

除了模型的提升,目前OpenAI已经与多家公司合作将GPT-4搭载到他们的产品中,官网列出的案例涵盖语言学习、金融、咨询、教育、生活助手、语言保护等领域。

“GPT-4改变了游戏规则,它开辟了很多领域。” 移动支付公司Stripe应用机器学习团队的产品负责人Eugene Mann说道。

GPT-4的发布正推动着创业者和互联网大厂纷纷跟进,国内在模型层可能暂时难以赶上,而在机会更多的应用层,目前国内的AI创业竞赛似乎才刚刚开始。

Q2:

1、笼子里有30只鸡和兔子,一共84条腿,有几只鸡几只兔子

2、笼子里有30只鸡和兔子,一共54条腿,有几只鸡几只兔子 (题目出错了,无解)

3、笼子里有10只鸭子和小狗,鸭子2条腿,小狗4条腿,一共24条腿,有几只鸭子几只小狗

文心一言: 都答错了。

Q3:帮我写一篇sk2大红瓶面霜的小红书种草笔记。小红书种草笔记的风格是,每行文字不超过20个字并且都以emoji表情符号开头,文风浮夸高调

文心一言: 指导你写,自己不写,并且显示不出emoji表情包。

Bing: 不能画图,但跟你聊天真开心。

以上是我们向文心一言和Bing提出的问题,考虑到文心一言目前尚在小范围内测,如果你有想问的问题,欢迎留言,我们帮你问。

1
点赞
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与华威派无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
凡本网注明 “来源:XXX(非华威派)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。
如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。
QQ:2443165046 邮箱:info@goodmaoning.com
关于作者
冷冷的太阳(普通会员)
点击领取今天的签到奖励!
签到排行
1
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索