早上好!Freemen又和大家见面咯!
靠谱的高薪工作已经帮您筛选完毕,
FreemenIT行业求职招聘app诚挚邀请您前来参与。
参与入口→「链接」
ChatGPT类产品提升生产效率的潜力,已经被不断验证。
但与此同时,前有 ChatGPT 大规模封号、亚洲成重灾区,后有 OpenAI 因算力问题停售 ChatGPT Plus…
国内推出自己的模型迫在眉睫,看得出国内的玩家们都在持续发力准备冲刺了。
今天Freemen为大家汇总了近日阿里上线的ChatGPT产品通义千问的实测情况。
明天为大家介绍另一款近期上线的国产ChatGPT产品,敬请期待!
通义千问(阿里版 ChatGPT)
阿里正式加入ChatGPT战局!通义千问由达摩院开发,目前只上线了内测版本,我们来看一看它的实测结果。
代码生成ChatGPT 能成为程序员的“辅助神器”,并成功“出圈”的最主要原因之一就是其出色的代码生成能力。因而,本次对「通义千问」的测评我们也先从这方面开始。
先来个简单的:用 Python 实现冒泡排序。
继续:请用 C 语言,使用动态分配内存的方式,模拟 C 中 Vector 容器,实现动态数组的构建。
对于以上「通义千问」生成的代码, CSDN-AI 团队研发总监如此评价:
“阿里云的模型对于随机抽取的常见代码片需求,基本能理解需求,生成合适的代码。能区分生成代码对指定语言的需求。能区分中英文问题输入。简单的冒泡排序和领域特定的逻辑回归代码,都能生成合适的代码,总体表现不错。在理解代码需求的推理能力上,则还有待加强。”
古怪问题大PK考考通义千问一些难倒老外的「汉语十级」考题。
请听题:您是要几等座?你们一共有几等座?特等一等二等等等,二等要多等一等。我看一下,等一等啊。别等了,再等一等就没了。那不等了,就这个吧。请问顾客最终买了几等座?
而在汉语十级难题面前,语言能力强大的GPT-4竟然也缴械投降了,直称自己无解。
而聪明的文心一言直接上升到经济学,分析了市场行情,认为2块豆腐一块钱更合理。
而对比之下,文心一言的EQ就显得很高了。
它说,「她可能已经和你说了很多次」,并给出了暖心建议,认真考虑你们关系是否健康,以及是否真正理解女朋友的需求和想法。
再问问「我的手机蓝牙坏了,请问去哪里修?」
整体来看问题不大,就是「通义千问」推荐的这个维修点,多少有点儿远——「iFixYouri」这个地址,直接跑美国区了。(文中的iFixYouriPhone应该是拼错了)
文心一言开始诚实地表示无法回答,第二次发问,它也开始胡诌了,说这个人是演员和导演。而到了第三次,它直接说这是个计算机。
GPT-4自始至终都对正确答案非常坚定。
和 GPT-4 的回答来比较一下
但如果不使用这个功能,通义千问就很不通风情,说可以夸你有魅力、受欢迎,但就是不能夸你美貌。
小学生作文在小学生作文功能中,我们让它以林黛玉倒拔垂杨柳,续写一段话。
通义千问能够模仿出小学生的语气,并在结尾升华到「这种精神很值得我们学习」,就,真的很小学生了。
会放飞的菜谱如果从百宝袋里问它如何做一盘麻辣螺丝钉,通义千问就会意了。
它会知道你就是想搞事情,所以不会纠正你这个东西有多不科学。
相关文章
猜你喜欢