5月18日下午,庆祝建校118周年相辉校庆系列学术报告第十场在光华楼东辅楼102报告厅举行。复旦大学国家智能评价与治理实验基地副主任、大数据研究院教授赵星,浙江大学公共管理学院信息资源管理系“百人计划”研究员蒋卓人于线上线下共话“生成式人工智能的挑战与治理”。复旦大学国家智能评价与治理实验基地副主任、图书馆副馆长王乐主持报告会。
从2011年苹果手机首次推出的Siri语音助手,到今年包揽奥斯卡七大奖项的电影《瞬息全宇宙》,生成式人工智能早已融入人类生活。当下,ChatGPT类工具进一步引爆全球人工智能热潮,赵星和蒋卓人携手带来一场贯穿生成式人工智能前世、今生和未来的学术盛宴,解析生成式人工智能带来的多重挑战,启发我们对其治理问题的思考。
生成式人工智能的前世今生
金色的夕阳被乌云遮住,小草在风雨中摇曳,水珠在叶片上滚动……蒋卓人首先播放了一段名为“Summer showers”(《夏日阵雨》)的视频。这段充满灵动色彩和生动风景视频,却完全是由生成式人工智能模型创作的。
何为生成式人工智能?
目前,生成式人工智能还没有统一的定义,一般可以理解为一种能够根据提示生成文本、图像或其他媒体信息的人工智能系统。
“这个技术不是像魔法一样凭空出现的,而是有着悠久的历史渊源。”蒋卓人强调。在生成式人工智能90多年的发展历程中,不乏人类智慧闪耀的时刻。
1932年,法国工程师Georges Artsrouni创造了装置“mechanical brain”(机器大脑)。它通过查询多功能词典完成翻译,输入、输出都是一条纸带。蒋卓人认为,虽然它和今天的机器翻译不同,但它完全符合今天对生成式人工智能的定义,即人类输入一段内容,机器产生一段新的内容。
在20世纪中,麻省理工学院创造了最早的生成式人工智能之一Eliza,Judea Peal(朱迪亚·珀尔)引入了贝叶斯网络因果分析概念,Yann Lecun(杨立昆)等展示了如何利用卷积神经网络来识别图像……
2006年,华裔计算机科学家李飞飞着手构建数据库ImageNet。该数据库中有超过1400万张手工标注的图片,包含超过2万个类别。“正是有了这样一个庞大数据库的支撑,深度学习才能得以兴起。所以我们总说,好的科研品味,加上持续不断的努力,就能成就一段好的学术生涯。”蒋卓人评价。
ChatGPT何以成为明星产品?
1750亿参数量,3000亿训练单词数,这是ChatGPT的数据。2022年发布后,ChatGPT在短短两个月内吸引了超过1亿的用户,成为有史以来用户增长最快的应用。
蒋卓人认为,要理解ChatGPT,就要理解它的关键技术:大模型基础训练、指令微调、人类反馈强化学习。
“大模型的全称是大型语言模型,”蒋卓人讲道,“它是一种概率模型,能告诉你一个词出现的概率是多少。”
蒋卓人
浙江大学公共管理学院信息资源管理系“百人计划”研究员
阿里巴巴达摩院语言技术实验室顾问;中国人工智能学会青年工作委员会委员;中国中文信息学会情感计算专委会委员,中国中文信息学会青年工作委员会通讯委员、信息检索专委会、社会媒体处理专委会通讯委员,广东省医疗行业协会超声医学创新与发展管理分会第一届委员会委员;ACM(国际计算机学会)Professional Member;ACM SIGIR(国际计算机学会信息检索专业组织)Member;ACL (国际计算语言学学会)Member;CCF(中国计算机学会)会员。
研究方向:计算社会科学,文本挖掘, 自然语言处理,信息检索
组 稿
校融媒体中心
文 字
许文嫣、朱宸颉
摄 影
廖恒
责 编
李怡洁
编 辑
刘怡然
相关文章
猜你喜欢