机器之心原创
机器之心编辑部
ChatGPT 军备赛开幕,哪些国内机构具备打造下一个 ChatGPT 的实力?
自从 2022 年底 ChatGPT 发布以来,海内外就掀起了一阵狂潮。推出仅两个月,ChatGPT 月活用户突破 1 亿,成为了史上用户增长速度最快的消费级应用程序。
ChatGPT 成为了搅动人工智能领域风云的新势力,其背后的 OpenAI 也因此成为了当下最热门的 AI 公司,甚至引发了科技巨头们的深度焦虑。
谷歌和微软两家科技巨头正在 ChatGPT 搜索上进行激烈竞争,先后宣布了将大型语言模型(LLM)整合到 Google 和 Bing 搜索中的计划。更有众多互联网公司迅速跟进,掀起了科技领域的又一场「军备竞赛」。有些机构开始着手研究同类型产品,有些机构从零开始布局对话式 AI 背后的一系列相关技术。
中国版 ChatGPT 将诞生于何处,也成为了大众最关心的问题之一。
鉴于 ChatGPT 是多项 AI 技术的集大成者,远非「一日之功」。这背后离不开算力、数据、人才等资源的支持。环顾国内群雄,谁最有可能造出下一个 ChatGPT?
在这篇文章中,机器之心将盘点国内最具实力的一批学术型机构和 NLP 研究领域带头人,共分为高校、大厂、非营利研究机构、初创公司四个部分,供大家参考、讨论。
如有盘点错误的地方,欢迎指正。
高校
清华大学自然语言处理与社会人文计算实验室
清华大学计算机系自然语言处理与社会人文计算实验室(THUNLP)成立于 20 世纪 70 年代末,是国内开展自然语言处理研究最早、深具影响力的科研单位。实验室围绕以中文为核心的自然语言处理,在大规模预训练模型、中文信息处理、机器翻译、社会计算、智慧教育和知识图谱等方面开展了系统深入的研究。
实验室学科带头人是孙茂松教授,教师团队包括刘洋教授和刘知远副教授。近年来,该实验室承担了一系列国家重点研发项目、国家社会科学基金重大项目等重要研究任务,并与腾讯、华为、阿里、美团等企业建立了密切的学术合作关系。相关成果产生的 Github 开源工具包共获数万星标。
代表成员:
孙茂松,THUNLP 实验室学术带头人,清华大学计算机与科学技术系长聘教授,清华大学人工智能研究院常务副院长,欧洲科学院外籍院士,中国人工智能学会、中国中文信息处理学会会士。研究方向为自然语言理解、中文信息处理、Web 智能、社会计算和计算教育学等。近几年在人工智能和自然语言处理领域顶级国际期刊或会议发表论文 200 余篇,获得国家授权发明专利 50 余项。作为首席科学家主持完成国家重点基础研究发展计划(973 计划)项目,国家社会科学基金重大项目。领衔研发中文诗歌自动生成系统「九歌」,累计为用户创作 3000 万首诗词。
刘洋,清华大学计算机科学与技术系长聘教授,清华大学智能产业研究院副院长,国家杰出青年基金获得者。担任中国人工智能学会组织工作委员会副秘书长、中国中文信息学会计算语言学专委会常务副主任。研究方向是自然语言处理、机器翻译,获得国家科技进步二等奖 1 项、省部级科技奖励 4 项、重要国际会议优秀论文奖 2 项。
唐杰,清华大学计算机系教授,曾入选 ACM Fellow、IEEE Fellow。主要研究领域包括人工智能、认知图谱、数据挖掘、社交网络和机器学习。2006 年毕业于清华大学,获博士学位。唐杰曾主持研发了参数规模超过 1.75 万亿的超大规模预训练模型「悟道」,以及研究者社会网络挖掘系统 AMiner,吸引了全球 220 个国家和地区的 2000 多万用户。
代表成果:
开源双语千亿预训练模型 GLM-130B 项目原作解读转载
清华大学交互式人工智能(CoAI)课题组
清华大学交互式人工智能课题组 (Conversational AI, CoAI) 隶属于清华大学计算机系、清华大学人工智能研究院。交互式人工智能是指通过对话、问答等语言交互方式体现出来的智能行为,是人工智能最具挑战性、最综合性的技术,涵盖了语义理解、知识表示、逻辑与推理、语言生成等各个方面。
课题组由朱小燕教授、黄民烈副教授指导,与众多国内外知名企业建立了广泛合作,例如华为、谷歌、微软、惠普、三星、斯伦贝谢、腾讯、阿里巴巴、搜狗、美团、好未来等。
代表成员:
朱小燕,清华大学计算机系教授、博士生导师。曾任智能技术与系统国家重点实验室主任、北京市计算机学会副理事长、清华大学计算机系副主任、加拿大国际开发研究中心(DIRC)首席科学家。1982 年获北京科技大学学士学位,1987 年获日本神户大学硕士学位,1990 年获日本名古屋工业大学博士学位,1993 年到清华大学任教。长期在智能信息处理领域开展深入研究,在人工神经元网络、机器学习、自然语言处理、信息获取、智能问答系统、交互智能和人机交互等方面取得显著成果。
万小军,北京大学王选计算机研究所研究员、博士生导师,语言计算与互联网挖掘研究室负责人,在北京大学获得学士、硕士与博士学位。研究方向为自然语言处理与文本挖掘,研究兴趣包括自动文摘、文本生成、情感分析、语义分析、多模态与多语言 NLP 等。曾担任计算语言学顶级国际期刊 Computational Linguistics 编委、国际会议 EMNLP-IJCNLP 2019 程序委员会主席,现任 CCF-NLP 专委会秘书长、TACL 执行编辑、NLE 编委、JCST 编委,10 多次担任相关领域重要国际会议领域主席,包括 ACL、NAACL、EMNLP、EACL,AACL 等。荣获 ACL2017 杰出论文奖、IJCAI 2018 杰出论文奖、2017 年吴文俊人工智能技术发明奖、CCF NLPCC 青年新锐奖等奖励。研制推出了多款 AI 写作机器人,如小明、小南、小柯等,应用于多家媒体单位。
冯岩松,北京大学王选计算机研究所副教授。2011 年毕业于英国爱丁堡大学,获得信息科学博士学位。主要研究方向包括自然语言处理;连续多年在面向结构化知识库的智能问答评测中获得第一名;相关工作发表在 ACL、EMNLP、TPAMI、AIJ 等自然语言处理领域顶级会议及期刊上。多次担任 ACL、EMNLP、NAACL、IJCAI 等领域重要国际会议的领域主席或高级程序委员会委员;作为项目负责人或课题骨干承担多项国家自然科学基金、科技部 863 计划和重点研发项目;分别在 2014、2015 年获得 IBM Faculty Award,2016 年 IBM Shared University Research Award。
复旦大学自然语言处理实验室
复旦大学自然语言处理实验室由复旦大学首席教授吴立德先生创建,是我国最早开展自然语言处理和信息检索研究的实验室之一。经过 40 余年发展,在自然语言处理底层分析、文本检索、自动问答、社会媒体分析等方面取得了一系列的研究成果。实验室多年在国家自然科学基金、国家 863/973 / 重点研发计划、省部委基金的支持下,发表了大量高水平国际期刊和会议论文,其中包括中国计算机学会推荐的 A/B 类国际会议和期刊论文(ACL,SIGIR,IJCAI,AAAI,NIPS,ICML 等)论文 150 余篇;参加多项国内外评测,如在自动问答国际评测 TREC/QA 中获得第 3 名,在文本蕴涵评测 RITE 和阅读理解评测 SQUAD 都位居前列;发布了国内首家中文自然语言开源系统 FudanNLP,被包括联合国教科文组织在内的国内外多家研发机构采用。
代表成员:
刘挺,博士生导师,哈工大计算学部主任兼计算机学院院长。多次担任国家 863 重点项目总体组专家、基金委会评专家。中国计算机学会理事,中国中文信息学会常务理事 / 社会媒体处理专委会(SMP)主任,曾任国际顶级会议 ACL、EMNLP 领域主席。主要研究方向为人工智能、自然语言处理和社会计算,是国家 973 课题、国家自然科学基金重点项目负责人。主持研制「语言技术平台 LTP」、「大词林」等科研成果被业界广泛使用。曾获国家科技进步二等奖、省科技进步一等奖、钱伟长中文信息处理科学技术一等奖等。
张伟男,哈尔滨工业大学计算机学院院长助理、副教授、博士生导师,黑龙江省中文信息处理重点实验室副主任。曾担任 ACL、EMNLP 领域主席、AAAI 高级程序委员会委员(SPC)及多个国际会议及期刊的程序委员会成员、审稿人及期刊编委。目前为中国中文信息学会青年工作委员会副主任,中国计算机学会(CCF)术语审定工作委员会执委、CCF 哈尔滨分部秘书长,中国人工智能学会教育工作委员会副秘书长,北京智源青源会会员。主要从事人机对话及自然语言处理等研究。在 ACL、AAAI、WWW、IJCAI、IEEE TKDE、ACM TOIS 等 CCF A 类国际会议及期刊发表学术论文多篇;主导研发了智能人机对话系统「笨笨」,2019 年 3 月「笨笨」中的开放域人机对话功能成功落地到科大讯飞 AIUI 智能交互平台;获黑龙江省科技进步一等奖、吴文俊人工智能科技进步二等奖及黑龙江省青年科技奖等。
中科院自动化所模式识别国家重点实验室自然语言处理团队
中科院自动化所模式识别国家重点实验室于 1984 年由国家计委批准筹建,1987 年通过国家验收并正式对外开放,依托于中国科学院自动化研究所。实验室目前的主要研究方向为模式识别、计算机视觉、图像处理与图形学,口语信息处理、自然语言处理以及模式识别应用与系统等。
代表成员:
冯洋,研究员、博士生导师,中科院计算所「新百星人才引进计划」入选者、2019 年度「卓越之星」获得者、自然语言处理课题组负责人。研究方向为自然语言处理、机器翻译、人机对话。在中科院计算所获得博士学位后,先后在谢菲尔德大学和南加州大学信息科学研究所(USC/ISI)开展研究工作。曾获 ACL 2019 最佳长文奖,为 ACL 开办 50 多年以来国内首次获得该奖项。多次在 NIST、CWMT、DSTC 等国内外权威机器翻译评测和对话系统比赛中获得第一名,作为项目负责人主持国家重点研发计划、国家自然科学基金面上项目等,与华为、腾讯、百度、字节跳动等公司开展合作研究。
中科院软件研究所中文信息处理实验室
中科院软件研究所中文信息处理实验室始于 1996 年成立的「开放系统与中文信息处理中心」。实验室当前主要围绕互联网环境下的自然语言理解这一中文信息处理领域的核心问题,开展中文信息的认知和理解机理、大规模中文知识图谱、基于知识的中文分析以及面向大数据智能服务的中文问答等关键技术研究。
实验室成员 2000 年起参加 TREC、NTCIR、DUC、TAC 等信息检索和自然语言处理领域的权威国际评测,并多次取得优异成绩。实验室目前承担着国家重大研发计划、国家自然科学基金重点项目、新闻出版署重大专项、国家语委重点项目、大型互联网企业合作(华为、阿里、百度)等 10 多项研究和开发任务,近年来在 ACL、SIGIR、AAAI、EMNLP 等顶级国际会议发表论文 50 多篇。
代表成员:
窦志成,中国人民大学高瓴人工智能学院副院长、教授,北京智源人工智能研究院「智能信息检索与挖掘」方向项目经理,基于大数据文科综合训练国家级虚拟仿真实验教学中心执行主任。2008 至 2014 年在微软亚洲研究院工作,2014 年开始在中国人民大学任教。主要研究方向为智能信息检索、自然语言处理、大数据分析。已在国际知名学术会议和期刊上(如 SIGIR、WWW、CIKM、WSDM、ACL、EMNLP、TKDE 等)发表论文 50 余篇,获 SIGIR 2013 最佳论文提名奖,AIRS 2012 最佳论文奖。
陈家骏,教授、博士生导师。南京大学计算机系自然语言处理实验室主任,中国中文信息学会理事。毕业于南京大学计算机软件专业,获学士、硕士和博士学位。20 世纪 80 年代就开始从事自然语言处理和软件工程领域的研究与系统开发工作,研究方向包括机器翻译、汉语语言处理以及程序设计语言等。承担过国家 863 高技术、国家自然科学基金、国家社科基金以及教育部博士点基金等项目的研究工作;获得过国家七・五科技攻关重大成果奖、教育部科技进步二等奖等科研奖励;发表学术论文 180 余篇,其中包括领域顶级会议和期刊(ACL、EMNLP、NAACL、TALLIP、TACL、AAAI、IJCAI 等)论文数十余篇。
进击的大厂
随着 ChatGPT 的出圈,很多国内大厂也开始支持类 ChatGPT 大模型研究。如果说学术界更看重理论前沿的探索,那么对于企业界来说,想要打造出「ChatGPT」则意味着在各个层面的能力均有所布局。
OpenAI 早在 2017 年就开始了 GPT 系列模型的研发,并且几年内来多次迭代。鉴于 OpenAI 并不是一家普通的「初创公司」,背后有微软提供的云算力支持,还有数年如一日、不计回报的高额研发投入,以及多年积累的海量用户数据。纵观国内,同时具备这几项基础条件的企业并不多。
在搜索业务和问答业务方面已积累了大量经验的企业更具优势,更可能走在前列。目前,在自然语言处理领域,百度、腾讯、阿里等大厂各种都有相关的技术沉淀和产品化的积累,在硬件、模型、产品层面的积淀尚可与 OpenAI 或者谷歌、微软这类硅谷巨头对标。
即使如此,做出对标 ChatGPT 的产品仍不容易,这也是当下各大企业实验室集中攻关的主题。
百度自然语言处理团队
百度是最早针对 ChatGPT 做出明确表态的公司之一,2 月 7 日即官宣在 3 月上线百度版 ChatGPT「文心一言」(英文名 ERNIE Bot)。
百度给出的回应中提到「ChatGPT 相关技术百度都有」:「百度在人工智能四层架构中有全栈布局,包括底层芯片、深度学习框架、大模型以及最上层的搜索等应用。」
在国内的科技企业中,百度大模型产品体系和开发工具是比较成熟的。此外,百度搜索早就接入了文心相关技术,这次「文心一言」的推出或将对百度搜索的升级起到重大作用。
近日,据 36 氪报道,百度目前筹备「文心一言」的团队主要由 TPG(技术中台事业群)、MEG(移动生态事业群)两大部门协同。前者负责技术攻坚,后者进行搜索、内容产品承接。项目由百度 CTO 王海峰任总指挥,其他带队高管还包括:百度集团副总裁吴甜(同时担任深度学习技术及应用国家工程研究中心副主任)、百度技术委员会主席吴华等人。
代表成员:
周靖人,哥伦比亚大学计算机科学博士,浙江大学兼职教授,IEEE Fellow。现任阿里巴巴集团资深副总裁,达摩院副院长。曾负责阿里云计算平台,淘宝和支付宝搜索、推荐、广告等数据智能业务。研究方向包括云计算、大数据、人工智能算法及应用。多次担任 VLDB,SIGMOD,ICDE 等国际顶级会议程序委员会主编、主席,在顶尖国际期刊和会议上发表论文超百篇,并拥有几十项技术专利。2022 年 12 月,任阿里云智能 CTO 兼任达摩院副院长。
何晓冬,京东集团副总裁,京东人工智能研究院执行院长,深度学习及语音和语言实验室主任,IEEE Fellow,同时在位于西雅图的华盛顿大学兼任教授、博士生导师。何晓冬博士的研究方向主要聚焦在人工智能领域。其在深度学习、自然语言处理、语音识别、计算机视觉及信息检索等方面均有重要贡献。其工作包括 DSSM(深度结构语义模型 / 深度语义匹配模型)和图像描述机器人 Caption Bot 等。在加入京东之前,何晓冬博士就职于美国微软雷德蒙德研究院,担任主任研究员(Principal Researcher)及深度学习技术中心(DLTC)负责人。何晓冬博士于 1996 年获清华大学学士学位,1999 年获中国科学院硕士学位,2003 年获美国密苏里大学 - 哥伦比亚分校博士学位。
吴友政, 京东集团高级总监,京东科技语音语言算法部负责人。2006 年中科院自博士毕业后,先后在日本国立信息通信研究机构、英国爱丁堡大学、索尼中国研究院从事自然语言处理相关研究工作。工作主要聚焦自然语言处理、人机对话、语音识别、机器翻译等前沿技术研究和产品研发工作,并取得了诸多技术突破,累计发表顶级国际会议和期刊论文 30 余篇,曾获得语音识别(IWSLT2012、IWSLT2013)和自然语言处理(QuAC2021,DROP2022,Multiwoz2022)领域多项国际比赛的冠军。他与团队密切合作打造了言犀人工智能应用平台,为客户提供涵盖客户服务、营销导购、流程自动化的整体智能化解决方案,为京东超 5.8 亿用户提供智能服务,也为零售、政务、金融、交通等行业提供产品与解决方案。
代表成果:
基于产业需求,京东云旗下言犀人工智能应用平台将推出 ChatJD,定位为产业版 ChatGPT,旨在打造优势、高频、刚需的产业版通用 ChatGPT。
ChatJD 将通过在垂直产业的深耕,快速达成落地应用的标准,并不断推动不同产业之间的泛化,形成更多通用产业版 ChatGPT,构建数据和模型的飞轮,以细分、真实、专业场景日臻完善平台能力,最终反哺和完善通用 ChatGPT 的产业应用能力。
ChatJD 将以「125」计划作为落地应用路线图,包含一个平台、两个领域、五个应用。
1 个平台:ChatJD 智能人机对话平台,即自然语言处理中理解和生成任务的对话平台,预计参数量达千亿级;2 个领域:零售、金融,得益于京东云在零售与金融领域 10 余年真实场景的深耕与沉淀,已拥有 4 层知识体系、40 多个独立子系统、3000 多个意图以及 3000 万个高质量问答知识点,覆盖超过 1000 万种自营商品的电商知识图谱,更加垂直与聚焦;5 个应用:内容生成、人机对话、用户意图理解、信息抽取、情感分类,涵盖零售和金融行业复用程度最高的应用场景,在客户咨询与服务、营销文案生成、商品摘要生成、电商直播、数字人、研报生成、金融分析等领域将发挥广泛的落地价值。腾讯AI Lab
腾讯 AI Lab 是腾讯的企业级 AI 实验室,于 2016 年 4 月在深圳成立。实验室由 100 余位来自世界知名院校的科学家,以及 300 多位经验丰富的应用工程师组成,并与世界顶级院校与机构合作,共同打造产学研用一体的 AI 生态。目前,实验室已在 ICML、CVPR、NeurIPS、ACL、ICASSP 等多个顶级学术会议或期刊累计入选论文超过 780 篇。
在基础研究方面,关注机器学习、计算机视觉、语音技术及自然语言处理等四大方向,780 多篇研究论文已覆盖国际顶级学术会议。在技术应用方面,聚焦在游戏、数字人、内容、社交四大领域,在微信、QQ 等 100 多个产品中落地。
在自然语言处理方向,腾讯 AI Lab 旨在借助腾讯丰富应用场景、大数据、计算力及一流人才方面的长期积累,赋予计算机系统以自然语言文本方式与外界交互的能力,追踪和研究最前沿的自然语言文本理解和生成技术,孵化下一代自然语言处理技术与商业应用场景。研究方向包括文本理解、文本生成、智能对话、机器翻译等。
除腾讯 AI Lab 之外,腾讯 QQ 浏览器实验室、微信 AI 实验室等均设有 NLP 方向的研究团队。
代表成员:
张正友,腾讯首席科学家、腾讯 AI Lab 及 Robotics X 实验室主任。1985 年本科毕业于浙江大学信息与电子工程系,于 1987 年在南锡第一大学(现洛林大学)获计算机科学硕士学位,并于 1990 年获巴黎第十一大学计算机科学博士学位。2021 年 1 月 8 日,张正友受聘腾讯历史上最高专业职级 ——17 级研究员 / 杰出科学家。
俞栋,腾讯 AI Lab 副主任,主要研究领域涵盖自动语音识别、语音处理和自然语言处理等,是将深度学习技术成功应用到语音识别领域的开创者之一。作为 100 多项专利的发明人及开源软件 CNTK 的发起人和早期主要开发者,俞栋发表了多篇引领性的论文,获得了 IEEE 信号处理协会 2013、 2016、2020 和 2022 年的最佳论文奖(表彰过去 6 年内发表的最佳期刊论文),2021 年 NAACL 最佳长文奖, 2022 年 IEEE 信号处理杂志最佳论文奖(表彰过去 10 年内发表的最佳论文),以及 2022 年 IEEE 信号处理杂志最佳专栏奖(表彰过去 10 年内发表的最佳专栏文章),谷歌学术引用量高达 5 万多次,h-index 超过 80。他提出的理论与模型已经广泛用于业界的语音识别和处理系统中。
代表成果:
腾讯公司的相关技术储备包括「混元」系列 AI 大模型、智能创作助手文涌(Effidit)等。
混元系列 AI 大模型来自腾讯广告多媒体 AI 团队,完整覆盖了 NLP(自然语言处理)、CV(计算机视觉)、多模态等基础模型和众多行业 / 领域模型。去年,混元 AI 大模型团队推出了万亿级别中文 NLP 预训练模型 HunYuan-NLP-1T,该模型已落地于腾讯广告、搜索、对话等内部产品并通过腾讯云服务外部客户。
智能创作助手「文涌」为腾讯 AI Lab 出品,实现融合了知识抽取、文本理解、文本生成、大规模预训练模型、经典语言模型、搜索等技术,具有智能纠错、文本补全、文本润色等功能,部分功能的实现使用「混元」系列 AI 大模型作为底层预训练模型。
在 2 月 9 日对 ChatGPT 的相关回应中,腾讯公司表示:「目前,腾讯在相关方向上已有布局,专项研究也在有序推进。腾讯持续投入 AI 等前沿技术的研发,基于此前在 AI 大模型、机器学习算法以及 NLP 等领域的技术储备,将进一步开展前沿研究及应用探索。」
科大讯飞
科大讯飞在 NLP 方面同样有诸多研究积累。2005 年,科大讯飞研究院正式成立。2017 年 12 月 13 日,科技部批准依托科大讯飞股份有限公司建设认知智能国家重点实验室。这一实验室是科技部首批 20 家标杆全国重点实验室之一,多年来始终保持关键核心技术处于世界前沿水平,在去年曾获得 CommonsenseQA 2.0、OpenBookQA 等 12 项认知智能领域权威评测的第一。实验室瞄准国际认知智能技术的理论和技术发展前沿,面向国家重大战略需求和人工智能产业发展,以人机交互、智慧教育、智慧医疗、智慧司法等领域对认知智能技术的广泛和共性需求为牵引,重点开展语义计算、知识建模等认知智能基础理论及技术研究。
与此同时,科大讯飞面向认知智能领域陆续开源了 6 大类、超过 40 个通用领域的系列中文预训练语言模型,成为业界最广泛流行的中文预训练模型系列之一,在 GitHub 获 13346 颗星,位列中文预训练模型星标数第一。
2 月 8 日,科大讯飞在投资者互动平台回应称,ChatGPT 主要涉及到自然语言处理相关技术,属于认知智能领域的应用之一,公司在该方向技术和应用具备长期深厚的积累。科大讯飞 AI 学习机将成为该项技术率先落地的产品,将于今年 5 月 6 日进行产品级发布。
代表成员:
杨植麟,循环智能联合创始人,清华大学交叉信息院 NLP 实验室负责人,智源青年科学家。本科毕业于清华大学,博士毕业于卡内基梅隆大学,Google Scholar 引用累计 10,000 余次,与多名图灵奖得主合作发表论文。作为第一作者发明的 XLNet 在 20 项任务上超越 Google BERT,是 2019 年全球引用最高的同行评审 NLP 论文。他发明的 Transformer-XL 是首个全面超越 RNN 的注意力语言模型,也是 ACL 2019 引用最高的论文。曾主导开发盘古 NLP 大模型,获世界人工智能大会「 2021SAIL 之星」,入选福布斯亚洲 30 under 30。他创办的公司循环智能累计融资超 4 亿元,连续三年营收增长超 100%。
追一科技
追一科技是一家企业级智能服务 AI 公司,创立于 2016 年 3 月,主攻深度学习和自然语言处理,为金融、零售、生活服务等领域企业提供智能服务系统和解决方案。追一科技的智能服务系统 AIforce,拥有 AI 语义理解能力、智能产品矩阵。
「我们始终站在自然语言处理(NLP)技术研发和实践的前沿,在大规模预训练模型、自然语言智能交互(NL2X)、NLG(自然语言生成)等领域屡有创新,并将我们的技术成果开放给业界,持续推动 NLP 技术的发展。」
代表成果:
追一在机器阅读理解与 NL2SQL 技术上拥有深厚积累,举办了国内首个中文 NL2SQL 比赛,并在机器阅读理解比赛中多次登顶榜首。
2021 年 4 月,追一科技开源了国内首个中文生成式预训练模型 T5 PEGASUS,在自动摘要、问题生成多个自然语言处理任务上达到了新高度。凭借出色的小样本学习能力,T5 PEGASUS 可以帮助企业和开发者大大减轻数据标注训练负担。
2021 年 11 月,追一科技联合粤港澳大湾区数字经济研究院(IDEA)发布 10 亿级大规模预训练模型「周文王」。
潞晨科技
类似于 ChatGPT 这样的大模型,对于任何一家企业来说,训练成本都是极高的。即使花巨资使用超级计算机集群、聘请专家,也难以实现 AI 模型的高效训练。针对这一行业痛点,也有很多初创公司在提出自己的解决方案,潞晨科技就是其中的代表。
2021 年,潞晨科技发布大规模并行 AI 训练系统 ——「夸父」(Colossal-AI) ,通过多维并行、大规模优化器、自适应任务调度、消除冗余内存、降低能量损耗等方式,旨在打造一个高效的分布式人工智能训练系统,作为深度学习框架的内核,帮助用户在最大化提升人工智能训练效率的同时最小化训练成本。
潞晨科技的团队核心成员均来自美国加州大学伯克利分校,斯坦福大学,清华大学,北京大学,新加坡国立大学,新加坡南洋理工大学等国内外知名高校。
代表成员:
尤洋,潞晨科技董事长兼总裁,新加坡国立大学校长青年教授。尤洋是 UC Berkeley 博士,曾创造 ImageNet 和 BERT 训练速度世界纪录,获 IPDPS 和 ICPP 最佳论文,西贝尔奖学金,ACM-IEEE HPC Fellowship,Lotfi A. Zadeh Prize,ACM Doctoral Dissertation Award,福布斯 30 岁以下精英榜(亚洲),IEEE-CS 超算杰出新人奖。
小冰公司
小冰公司前身为微软(亚洲)互联网工程院人工智能小冰团队,是微软全球最大的人工智能独立产品研发团队。该团队于 2013 年 12 月在中国组建,2014 年 9 月扩展建立日本研发分部,团队分布于北京、苏州、东京等地,技术产品覆盖中国、日本及印度尼西亚等多个国家,商业客户覆盖全球范围。为加快小冰产品线的本土创新步伐,促进小冰商业生态环境的完善,2020 年 7 月 13 日,微软宣布将小冰分拆为独立公司运营。
作为微软全球首个以中国为总部的人工智能产品线,小冰经多年发展,已成为微软最有价值的人工智能技术框架之一。小冰框架以自然语言处理(NLP)为基础,持续推动完备迭代发展,目前是全球承载交互量最大的完备人工智能框架之一,技术覆盖自然语言处理、计算机语音、计算机视觉及人工智能内容生成。其中,在开放域对话、多模态交互、超级自然语音及内容生成领域居于全球领先。
代表成员:
李笛,2013 年加入微软,同年创立微软人工智能情感计算框架,于 2014 年推出微软小冰。小冰是目前全球范围内承载交互量最大的人工智能系统,占全球交互总量 60% 以上。2020 年 7 月,微软宣布将小冰分拆为独立公司运营,李笛担任小冰公司 CEO。
徐元春,小冰公司首席运营官、人工智能创造力实验室负责人,CCF 计算艺术分会执行委员,中国音像与数字出版协会音乐产业促进工作委员会专家委员会特聘专家,中国乐器协会未来音乐科技专业委员会委员。从 2017 年开始领导团队从事小冰在 AI 创造领域的技术研发、产品革新和应用落地。致力赋予 AI 拟合人类的创造能力,运用 AI 技术展开具有创造性的内容生成,并倡导通过 AI 技术解决高度定制化内容的供需矛盾。目前在文本、声音与视觉方面掌握全球领先的核心技术,拥有丰富的包括端到端的音乐创作(作词,作曲,编曲)、诗歌(现代诗,古诗)、绘画(西方油画,中国画)、艺术设计等创造模型,在 AI 创造领域不仅内容形态众多且质量稳定,并已形成完善的产品线,以及广泛的合作伙伴生态阵营。
思必驰
思必驰是国内专业的对话式人工智能平台公司,拥有全链路的智能语音语言技术,自主研发了新一代人机交互平台(DUI),和人工智能芯片(TH1520);为车联网、IoT及政务、金融等众多行业场景合作伙伴提供自然语言交互解决方案。截至2021年底,思必驰拥有各类已授权知识产权900余件,其中已授权专利近400项,软件著作权近300项。并拥有中英文综合语音技术。思必驰语音识别、声纹识别、口语对话系统等技术曾经多次在美国国家标准局、国际研究机构评测中夺得冠军。
思必驰被列入国家发改委「互联网 」重大工程和人工智能创新发展工程、工信部人工智能与实体经济深度融合创新项目、江苏省工业和信息产业转型升级项目、江苏省科技计划项目等,并累计参与40余项国家标准、行业标准制定。凭借雄厚的AI技术实力与广泛的产品业务落地,2020年,思必驰完成pre-IPO轮融资;2021年3月,思必驰完成股份制改造,正式更名为:思必驰科技股份有限公司。
代表成员:
俞凯,思必驰创始人、首席科学家、上海交大教授上海交通大学-苏州人工智能研究院执行院长。剑桥大学工程系博士,入选国家级人才工程、科技部中青年科技创新领军人才,国家自然科学基金委优青。中国计算机学会语音对话及听觉专业组副主任,中国人工智能产业发展联盟学术和知识产权组组长,中国语音产业联盟技术工作组副组长。2014年获得“吴文俊人工智能 科学技术奖”进步奖,2016年获评“科学中国人年度人 物”。IEEE高级会员,IEEE Speech and Language Processing Technical Committee委员。 在一流国际期刊和会议上发表论文 180 余篇,担任InterSpeech、ICMI等国际权威学术会议程序委员会主席,以及ACL、EMNLP、InterSpeech等国际会议的语音和对话技术领域主席,多次获得国际权威期刊和会议优秀论文奖,以及多个国际公开研究评测竞赛冠军。
面壁智能
面壁智能(ModelBest)是一家人工智能大模型加速与应用落地赋能公司。公司依托开源社区打造大规模预训练模型库与相关工具,加速百亿级以上大模型的训练、微调与推理,降低大模型使用门槛,并进一步推动大模型在人工智能典型场景与领域的应用与落地。
公司创始团队来自于清华大学计算机系自然语言处理与社会人文计算实验室,并由知名清华大学教授担任首席科学家。公司目前已完成百万级天使轮融资,并与知名机构与公司达成战略合作。
聆心智能
AIGC 初创企业聆心智能由清华大学黄民烈教授创立,成立于 2021 年 11 月,由清华大学计算机系孵化。团队核心成员均来自于清华大学、卡内基梅隆大学、谷歌等国内外顶尖高校及公司,具有丰富的商业化经验。聆心智能的核心人员是国内最早开展大模型底层技术的团队,在语言生成、对话生成方面具有独特的技术优势。
自成立以来,聆心智能致力于将最先进的人工智能技术应用到精神健康的数字诊疗服务上,通过建立先进的 AI 数字疗法体系,为临床患者和广大心理亚健康人群提供高质量、低成本、个性化、全天候的情绪支持、心理咨询和干预方案,为用户提供更科学、高效的精神健康服务。
作为 AI 心理赛道中自然语言处理基因领先的创业团队之一,聆心智能已开发了心理咨询及朋辈支持服务线上平台聆心悠然、AI 数字疗法软件聆忧,可为不同需求层次的用户提供服务。
代表成果:
基于生成式大模型,聆心智能打造了 Emohaa 情绪疗愈机器人,并与知名精神心理平台好心情达成合作,成功落地了国内首款人工智能心理陪伴数字人;与高端豪华电车品牌 Beyonca 合作,打造了新一代智能驾舱的贴心助手。
同时,聆心智能自研全球技术指标领先的中文对话大模型 OPD,在自动评测和人工评测中显著优于同类模型;去年 11 月,推出了首个超拟人 AI 产品 ---「AI 乌托邦」,该系统允许用户快速定制 AI 角色,只需要输入简单的角色描述,就可以生成相应人设的 AI ,与之进行深度对话和聊天。
相关文章
猜你喜欢