梦晨 金磊 发自 凹非寺量子位 | 公众号 QbitAI
什么样的AI,能通过自家公司的程序员面试?
刚刚出炉的国产大模型「天工」做到了,黑马,绝对是黑马。
其开发商昆仑万维的CEO方汉在与量子位合作的首发直播中透露:
对天工模拟过校招算法工程师的第一轮面试,可以很流畅地通过。
接下来要考验的是天工的创意能力,毕竟新晋独角兽Jasper.ai就是靠AI创意营销起家,AI有了这方面能力商业化就有了保障。
直播中由于时间关系,只展示了编写二次元mmorpg游戏广告文案一个例子。
不过方汉补充道“由于每个人输入的条件和上下文不同,生成的结果也会千差万别,对广告文案工作非常有帮助。”
其一般分为选择、扩展、模拟和回溯四个过程,核心思想总结来说就是把资源放在更值得搜索的分枝上。
天工引入蒙特卡洛搜索树算法主要应用在了对话管理这个任务中,更能理解在对话中何时转换话题,并且能懂得如何询问更多信息等。
这也就是天工拥有超强记忆能力、能够支持1万字以上文本对话、20轮交互,而且过程可以非常自然的原因了。
但除了模型和算法之外,天工的“利刃”还不仅于此。
中国最大GPU集群加持数据和算力,亦是这轮ChatGPT、大模型之战的关键所在。
在数据方面,天工所采用的策略是“开源的力量”——凝聚了百位开源社区AI科学家。
也正因如此,天工从数十万亿的数据中,最终清洗、筛选出了近3万亿单词的数据。
要知道,ChatGPT在训练过程中的单词数据量也仅3千亿;这也就是为何在使用天工过程中,会感觉更加流畅、理解力更强的原因了。
那么面对如此庞大的数据训练量,接踵而至的老大难问题,便是算力了。
对此,昆仑万维方汉在直播过程中非常自信地表示:
天工的算力是基于中国最大的GPU集群之一。
这也就是ChatGPT在支持十轮对话的时候,天工能够达到20多轮的原因所在了。
但若是纵览昆仑万维在技术上的布局,就不难发现,天工的诞生并非是一蹴而就的事情。
因为早在2020年昆仑万维便已然入局,累计投入了已达数亿元人民币、数百人参与研发。
并且在2022年发布AIGC全系列算法模型的同时,就开源了百亿级参数模型,积累了广泛的开发者好评与社区共创。
而至于为何选择在这个时间节点发布天工,方汉表示:
是综合考虑了技术水平和用户需求后做出的选择。
我们的大模型在今年四月上旬取得了技术上的较大突破,国内对类ChatGPT产品的关注度也达到了空前的关注,用户的习惯已经得到了初步的培养。
因此在这个时间节点推出,便可以很好地满足用户的现实需求。
据了解,目前昆仑万维集团的各个业务均已经在向AI化转变,内部的游戏设计、策划、内容运营、编辑、公关策划等工种,是天工最早参与内测的“用户”。
在未来,昆仑万维也有计划向B端用户开放API接口。
总而言之,有大数据、有大算力、有大模型,昆仑万维在国产ChatGPT之战上的前行道路,是值得期待一波了。
天工官方地址:https://tiangong.kunlun.com/
直播回放地址:https://live.baidu.com/m/media/pclive/pchome/live.html?room_id=8207784475
— 完 —
量子位 QbitAI · 头条号签约
关注我们,第一时间获知前沿科技动态
相关文章
猜你喜欢