编辑:编辑部
【新智元导读】官宣2个月后,李志飞带着大模型「序列猴子」来了。不排队,直接用,超长测评报告出炉!(往后翻,「言之画」有个小彩蛋)ChatGPT国内赛,又有一位玩家交卷了。
今年2月,国内赛正式宣战,各方势力轮番出场。当时,出门问问创始人、CEO李志飞就是高调入局的创业者之一。
才过了两个多月,就有结果了。
相当于,新媒体文案这一块儿,写稿、视频、小红书、知乎「奇妙文」全包了。
AI,帮我打个工测试开始,先来让它给「新智元」账号写一个简介。
在提示框中输入账号名称,目标用户,具体描述特点,以及关键信息。
输出的第一段中规中矩,涵盖了提示的几个点。
让人意想不到的是,在接下来的内容生成中,不仅点出我们提供前沿科技资讯,还提供互动平台。
嗯,你是懂「新智元」的。
给出一段具体内容:
经历过推迟风波后,埃隆·马斯克旗下太空探索技术公司SpaceX的新一代运载火箭星舰终于点火发射,但在空中爆炸,首次轨道级试飞以失败告终。马斯克随后发文回应,先是祝贺了SpaceX团队的努力,并表示为几个月后再次发射学到了很多。
「奇妙文」言简意赅,给出了标题「SpaceX星舰试飞失败,马斯克:学到了很多!」。
选择风格转换中的「自由幽默」后,它开始将马斯克亲切地称为「马院士」。
生成配图,有那味了最近走火的淄博烧烤,已经成为全民级网红打卡地。
不仅用了各种表情包,而且短短几行字,分析的面面俱到,最后还附上了标签#,有那味儿了。
虽然三段式的写作方式多少有些出戏,但让AI根据这个内容生成的配图,还是非常惊艳的。
不得不说,这冒着油的两串烤肉,还真有些让人垂涎欲滴。
嗯,它在做一种很新的冰淇淋。
另外,「奇妙文」还能为我们提供短视频灵感。
那就请它给咱们提供一下「龙傲天誓死守护刘波」这个短视频的创意吧。
做数学、写代码,怎么样?现在,但凡是个大语言模型的评测,大家都会出道「鸡兔同笼」试上一试。而各路研发团队看到这个架势,估计也纷纷连夜给模型单独做了加强训练。
为了避免「鸡兔同笼」这四个字可能会触发的隐藏机制,我们特地在测试中换成了「萝卜白菜」:
小明和妈妈去市场从而买菜,已知白菜5元1斤,萝卜8元1斤,总共买了10斤白菜和萝卜,花了62元,那么白菜和萝卜各买了多少斤?
不错,第一次就成功地解出了答案。
考虑到模型的随机性,我们又进行了几次测试。
但结果却是,有时候能做对,有时候做不对,效果比较一般。
主打的就是一个写作助理不过,从官方的介绍来看,「奇妙文」目前重点关注的还是文字编辑场景。
「奇妙文」能够在用户撰写年终总结、客服话术、剧本、广告文案等内容时,为其源源不断地提供灵感和创意方向。
在这一点上,根据刚刚的体验,通常在多尝试几次之后,基本都会有比较满意的结果。
至于数学、代码这类理工科的问题,模型现在还有所欠缺,但据说团队已经在改进了。
言之画
接下来是另一个已经开放体验的项目——AI画画。
不过,模型的类型是必选的,比如二次元、通用、照片等。
根据这个prompt,「言之画」生成了这张图。而且没想到的是,马院士的手部竟然被处理得相当不错。
人物写实模型
不过,这些粗糙的提示显然还是不够惊艳,不如我们求助一下别人的专业「咒语」吧:
female ornate princess, with white long flowing hair, bright beautiful eyes, trending on artstation, flowers of hope by Jean-Honor Fragonard, Peter mohrbacher, hyper detailed, insane details, stunning, intricate, elite, art nouveau, ornate, liquid wax, elegant, luxury, Greg Rutkowski, ink style, sticker, vector-art beautiful character design, double exposure shot, luminous design, award winning, masterpiece, amoled black background
首先用「通用模型」试一下。
优雅的公主披着白色的长发,大而明亮的眼睛注视着远方,可以说是相当华丽了。
风潮
小编2号:
体验地址:moyin.com
此外,「魔音工坊」支持对选定声音进行包括平静、悲伤、开心在内的7种情绪的调节,对包括女中年、男孩等在内的10种角色进行迁移。
同时还开放了韵律调节、局部变速、多人配音等AI声音个性化编辑功能,让用户能够像用word编辑文档一样编辑声音。
除了选择声音、编辑声音,「魔音工坊」还将推出「捏声音」功能,这样你就可以自由选择性别、年龄、语言、风格和情绪等声音特征,从0到1创作自己喜欢的声音了。
奇妙元配音有了,给它一个完美的外表吧。AI数字形象创作及直播平台「奇妙元」恰恰能够做到这一点。
目前,「奇妙元」现有超100款数字人、超1000款3D数字资产、超1000种声音。
而出门问问自研大模型的构建原理,就与「无限猴子」类似。
海量文本序列通过自主算法的不断训练,经由大规模算力消化理解,便练成了「序列猴子」。
目前,这个大模型已经具备了一定的自然语言理解、知识、逻辑以及推理等能力。
All In AGI:「出门问问」大模型之路可以说,在「序列猴子」大模型加持下,出门问问专为创作者打造的CoPilot能力确实让人眼前一亮。
那么,这家人工智能公司,凭什么能够在国内大模型创业赛道上抢跑?
根据公开资料,出门问问的创始人李志飞,曾在美国约翰霍普金斯大学攻读博士学位,一直研究自然语言处理和机器翻译。毕业后,入职谷歌,主导开发了谷歌手机版离线翻译等一系列产品。
2012年,前谷歌AI科学家李志飞离职后回国,他召集来自斯坦福、马里兰、 MIT,以及清华、北大等海内外著名高校的工程师,组建了称为「美国名校收集器」的出门问问,从0到1构筑起语音识别、语义理解、对话管理、垂直搜索等核心技术,并始终保持世界一流水平。
2015年,李志飞在寻求AI语音的商业化路径时,选择了智能硬件赛道,发布了一系列明星级的智能手表。
接下来的2-3年里,出门问问发布了几款不同的智能硬件产品。这一过程中,这家公司沉淀下一套完整的语音交互技术栈和软硬结合的能力。
2020年,出门问问开始布局生成式AI,GPT-3横空出世,点燃了李志飞对AGI的热情。随后,他组建了十几个人团队,并于2021年发布了大模型UCLAI。
同时,还推出了第一款AIGC商业化产品——AI配音平台「魔音工坊」,这一平台在全球获超百万量级付费用户,正式开启了出门问问AIGC商业化的序幕。
开放平台地址:openapi.mobvoi.com
据了解,出门问问目前已经与首批十大行业的内测探索伙伴达成了合作,包括汽车、教育、律所、金融、医疗、旅游等领域。
从创立至今,出门问问始终是国内语言技术的开拓者,是一家真真切切做技术的公司。以往,它的AI能力通过可穿戴式的硬件形式进行落地。未来,它将以CoPilot的形式赋能企业和个人。
可以说,我们所看到的「序列猴子」大模型的能力与出门问问自身十多年的AI技术积累一脉相承,从语音助手到智能助理,是其在AI领域十年磨一剑厚积薄发的结果。
正如李志飞所称,「序列猴子」还是一个每天都在不断进步的baby。
通过不断学习,相信未来,「序列猴子」大模型会带给我们更多的惊喜。
参考资料:
相关文章
猜你喜欢