> 自媒体 > AI人工智能 > 这家大模型豪言半年内超越ChatGPT(内附测评)
这家大模型豪言半年内超越ChatGPT(内附测评)
来源:全天候科技
2023-05-22
242
管理

6月9日,突破开放性问答,如实时问答;多轮对话能力再次升级;数学能离再上台阶。8月15日,突破代码能力;多模态交互能力正式开放给客户。10月24日,在通用大模型领域对标ChatGPT,其中中文能力超越后者,英文能力与后者相当。

作者|于惠如 编辑|罗丽娟

“认知大模型成为通用人工智能的曙光,科大讯飞有信心实现‘智能涌现’。”

5月6日,科大讯飞星火认知大模型揭开神秘面纱。发布会上,科大讯飞董事长刘庆峰、科大讯飞研究院院长刘聪在现场实测了讯飞星火在七大维度上的核心能力,包括多风格多任务长文本生成、语言理解、泛领域开放式知识问答、情境式思维链逻辑推理、多题型可解析数学、多功能多语言代码,以及多模态输入和表达等。

在数学能力中,除了常规计算、几何、情景应用等,讯飞星火解答了复杂的计算题答案。在刘庆峰看来,数理能力一定程度代表了一个大模型的聪明程度。“讯飞星火大模型不仅在国内系统中遥遥领先,也超过了ChatGPT。”

此外,刘聪还展示了大模型面向泛领域开放式知识问答能力、逻辑推理能力与代码能力。在多模态能力方面,星火大模型能够根据关键词句生成语音、图片、视频等素材,并可生成虚拟人进行视频展示。

不过,据官方介绍,讯飞星火的多模态能力目前还在测试中,最迟8月会提供给VIP客户使用。

打通“大模型 产品”闭环生态

讯飞星火认知大模型发布的当天,科大讯飞还同时发布了基于该大模型的教育、办公、汽车和数字员工等多个领域相关产品。

以汽车为例,讯飞火星认知大模型与智慧座舱的结合,可以实现车内跨业务、跨场景人车自由交流。基于大模型的智能座舱将更自由、拟人化、更懂汽车、更开放。

在学习机中,新增talktalk功能,实现中英文对话,存量学习机可更新迭代。办公本和录音笔中,新增语篇规整、要点总结、一键成稿,存量产品也可更新使用。

基于自然语言生成业务流程和RPA,在“大模型 数字员工”应用场景,可以帮助企业员工完成大量重复性工作。

现场以公司招聘事项为例,输入指令后,系统即可自动按照事先设计的RPA脚本,操作计算机中的相应软件,实现业务流程的自动化操作并输出结果,并进行数据分析。

刘庆峰透露,上述领域外,讯飞星火认知大模型还将赋能包括医疗、城市、政法、工业等在内的更多行业,满足更多专业领域的需求,向更广阔的产业领域延伸。

据了解,首批来自36个行业的3000余家企业开发者将接入星火大模型。

测试体验

星火大模型“成色”究竟如何?全天候科技亲测了多个场景下的问题,不妨一起来看一看它回答的如何。

我们先让星火大模型介绍了自己和竞品。

很明显,简单介绍没有问题,但当主语更复杂,需要理解时,它的理解能力“不在线”。

我们又让讯飞星火展现了文字创作能力——根据要求写一首诗。

然而,对于“特种兵”式旅游这个网络热梗,讯飞星火知道一点,但知道的不多。不过,它的“态度”很好,当我们提出错误,它能认识到自己的错误,并且道歉。

在测试过程中,全天候科技发现,讯飞星火的部分语料库并未更新至最新事件,对一些实事仍然给出错误答案。比如,当我们问“北京冬奥会自由式滑雪女子U型场地冠军是谁”时,它给出的答案是:法国选手特兰斯·勒贝克 (TraceLeBerque)。不过,当我们给出正确答案后,它又立马承认自己的错误并道歉。

我们抛出了刘庆峰对其已“超越ChatGPT”的夸赞,并让它证明自己。它没有承认,并已学会了“打太极”。

0
点赞
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与华威派无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
凡本网注明 “来源:XXX(非华威派)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。
如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。
QQ:2443165046 邮箱:info@goodmaoning.com
关于作者
快乐的老范(普通会员)
点击领取今天的签到奖励!
签到排行
0
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索