当地时间 3 月 14 日,OpenAI 宣布正式发布 GPT-4,它拥有图像识别功能、高级推理技能、以及处理 25000 个单词的能力,在单词处理能力上是 ChatGPT 的八倍,并可以用所有流行的编程语言写代码。OpenAI 还表示 GPT-4 大大优于现有的大型语言模型、以及大多数下一代(SOTA,State Of The Arts)模型。
(来源:资料图)
据介绍,GPT-4 在模拟律师考试中的成绩超出 90% 的人类考生,在 SAT(Scholastic Aptitude Test,俗称“美国高考”)的阅读考试中超出 93% 的人类考生,在 SAT 数学考试中超出 89% 的人类考生。
而同样面对律师资格考试,GPT-4 的上一版 GPT-3.5 的得分,仅仅超出 10% 左右的人类应试者。在现场演示中,GPT-4 还生成了关于复杂税务查询的答案,尽管无法验证其答案。
在美国,每个州的律师考试都不一样,但一般包括选择题和作文两部分,涉及合同、刑法、家庭法等知识。GPT-4 参加的律师考试,对于人类来说即艰苦又漫长,需要两天才能完成。而 GPT-4 却能在专业律师考试中脱颖而出。
通过律师考试并不意味着它已准备好取代真正的律师。毕竟通过司法考试的人大有人在,因此 GPT-4 不能成为真正的律师,但它确实展示了一定的本领,也能快速启动一些法律任务。
(来源:资料图)
图像识别、高级推理、庞大的单词掌握能力,是 GPT-4 的三大特点。
就图像识别功能来说,GPT-4 可以分析图像并提供相关信息,例如它可以根据食材照片来推荐食谱,为图片生成图像描述和图注等。但是,出于对潜在滥用的担忧,OpenAI 推迟了图像描述功能的发布。也就是说,GPT-4 的图像输入功能还处于尚未公开的预览阶段,目前仅能在 OpenAI 的直播中观看效果。
就高级推理功能来说,GPT-4 能够针对 3 个日程做出会议时间安排,回答存在上下文关联性的复杂问题。
就词汇量来说,由于最多可以处理 25000 个单词,因此在理解和生成长篇内容上,GPT-4 的能力更强。
“狂潮”与隐忧相伴相生
回顾历史,最早描述 GPT 的论文发表于 2018 年,GPT-2 于 2019 年公布、GPT-3 则于 2020 年公布。这些模型基于巨大的文本数据集训练而来,其中大部分是从互联网上抓取的数据。
事实上,OpenAI 原本推迟了 GPT-4 的发布,因为担心会被用于恶意目的,例如生成垃圾邮件和错误信息。但在 2022 年底,该公司推出了 ChatGPT——一种基于 GPT-3.5 的对话式聊天机器人,并可以被任何人免费试用。
ChatGPT 的推出在科技界引发了一场狂潮,谷歌也紧随其后。
在大模型上,对手们一直在积极回应 OpenAI。几乎在同一时间,OpenAI 的竞争对手——一家名为 Anthropic 的初创公司推出了一款名为 Claude 的聊天机器人。Anthropic 最近从谷歌筹集了 3 亿美元。与 GPT-4 一样,名为 Claude 的聊天机器人支持广泛的文本处理。它可以汇总文档、生成新文本、回答搜索查询和编写代码,以及执行其他任务。Anthropic 表示其已将这款聊天机器人提供给许多早期客户。同时在视频生成大模型上,Meta 有 Make-A-Video,谷歌则有 Imagen Video,它们都能根据用户输入来制作视频。而在北京时间 3 月 16 日,百度也将推出文心一言大模型。
随着 AI 语言模型的日益突出,对其潜在滥用的担忧也有所增加。批评者认为,OpenAI 等公司正急于利用未经测试、不受监管和不可预测的技术,这些技术可能会欺骗人们、威胁艺术家的作品并造成现实世界的伤害。尽管存在这些担忧,但 GPT-4 和类似的 AI 模型,确实提供了巨大的经济潜力。
支持:Ren
参考资料:
https://voonze.com/discover-openais-revolutionary-ai-gpt-4-the-most-advanced-model-yet/
https://www.gizmochina.com/2023/03/14/gpt-4-aces-professional-exams/
https://siliconangle.com/2023/03/14/openai-debuts-gpt-4-rival-anthropic-rolls-new-claude-chatbot/
https://www.theverge.com/2023/3/14/23638033/openai-gpt-4-chatgpt-multimodal-deep-learning
相关文章
猜你喜欢