实测文心一言，与GPT-4差距在哪？-华威派

> 自媒体 > AI人工智能 > 实测文心一言，与GPT-4差距在哪？

实测文心一言，与GPT-4差距在哪？

来源：新榜

2023-05-04

269

管理

本周无疑是AI爆炸周。

昨晚微软推出了Microsoft 365 Copilot，Office软件全面接入生成式AI功能。

而在刚刚过去的疯狂星期四，“中国版GPT”文心一言也迎来了备受关注的高光时刻。当天下午2点，百度创始人李彦宏出现在发布会现场，展示了文心一言的使用场景表现。

据悉，3月16日起，首批用户可通过邀请码在文心一言官网体验产品，后续将陆续开放给更多用户。

文心一言：是不及预期，还是值得期待？

“十月怀胎，一朝分娩。”

正式发布文心一言之前，李彦宏用这样一句话概括百度多年来在文心AI系列产品上的布局。2019年3月，百度推出文心ERNIE 1.0以来，期间经历了多次迭代，此次发布的文心一言是在过往产品上的延续与升级。

李彦宏还表示，对文心一言，大家的期望值是要对标ChatGPT，甚至要对标GPT4，这个门槛还是很高的。全球的大厂当中，百度是第一个发布的。（ChatGPT由OpenAI开发，不隶属于微软，双方为合作伙伴关系）

在产品演示环节，李彦宏分别演示了文心一言在文学创作、商业文案创作、数理推算、中文理解和多模态生成五种使用场景中的表现，比如总结小说《三体》的核心内容，给公司起名、写标语，计算鸡兔同笼数学问题，以及根据文本自动生成图片、视频等。

不过目前图像输入仍属于研究方面预览，没有对C端用户开放。

2.更长的上下文

GPT-4能够处理超过25000个单词的文本，允许使用长格式内容创建、扩展对话以及文档搜索和分析等。这意味着用户不用像之前那样分成几段文字来提问，处理长文本更方便了。

比如输入一个蕾哈娜的百科网址，GPT-4可以读取其中的内容并根据要求整合信息，回答出她在超级碗上的表现如何。

此外，相比上一代的GPT-3.5，GPT-4的回答深度和专业性、解决难题的能力等也显著提高。

据官方介绍，在随意的谈话中，GPT-3.5和GPT-4之间的区别可能很微妙。但当任务的复杂性达到足够的阈值时，差异就会出现——GPT-4比GPT-3.5更可靠、更有创意，并且能够处理更细微的指令。

在安全问题上，OpenAI花了6个月的时间使GPT-4更安全、更一致，据内部评估，与GPT-3.5相比，GPT-4响应违规内容请求的可能性降低82%，产生事实响应的可能性高40%。但OpenAI承认，GPT-4仍然不完全可靠，例如会生成有害建议、错误代码或不准确信息，我们在使用时需要谨慎辨别。

除了模型的提升，目前OpenAI已经与多家公司合作将GPT-4搭载到他们的产品中，官网列出的案例涵盖语言学习、金融、咨询、教育、生活助手、语言保护等领域。

“GPT-4改变了游戏规则，它开辟了很多领域。” 移动支付公司Stripe应用机器学习团队的产品负责人Eugene Mann说道。

GPT-4的发布正推动着创业者和互联网大厂纷纷跟进，国内在模型层可能暂时难以赶上，而在机会更多的应用层，目前国内的AI创业竞赛似乎才刚刚开始。

Q2：

1、笼子里有30只鸡和兔子，一共84条腿，有几只鸡几只兔子

2、笼子里有30只鸡和兔子，一共54条腿，有几只鸡几只兔子（题目出错了，无解）

3、笼子里有10只鸭子和小狗，鸭子2条腿，小狗4条腿，一共24条腿，有几只鸭子几只小狗

文心一言：都答错了。

Q3：帮我写一篇sk2大红瓶面霜的小红书种草笔记。小红书种草笔记的风格是，每行文字不超过20个字并且都以emoji表情符号开头，文风浮夸高调

文心一言：指导你写，自己不写，并且显示不出emoji表情包。

Bing：不能画图，但跟你聊天真开心。

以上是我们向文心一言和Bing提出的问题，考虑到文心一言目前尚在小范围内测，如果你有想问的问题，欢迎留言，我们帮你问。

赏钱

免责声明：本文仅代表作者个人观点，与华威派无关。其原创性以及文中陈述文字和内容未经本网证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。
凡本网注明 “来源：XXX（非华威派）”的作品，均转载自其它媒体，转载目的在于传递更多信息，并不代表本网赞同其观点和对其真实性负责。
如因作品内容、版权和其它问题需要同本网联系的，请在一周内进行，以便我们及时处理。
QQ：2443165046 邮箱：info@goodmaoning.com

微软将GPT-4接入Office办公，只需说几句话就能写PPT做表格

2023-05-04 16:48

文坛名家聚焦：GPT-4来了翻译会是文学领域最先“失守”疆土吗？

2023-05-04 16:46