周二,Meta 发布了最新一代的开源大语言模型 Llama 2。
这也意味着众多研究机构和商业公司可免费使用开源的 Llama 2,无需自己耗费巨大的成本来开发一个大模型,降低了企业的研发成本,有利于 Meta 争取更多的合作伙伴。
目前与 Llama 2 合作的就包括了微软、亚马逊、IBM、高通、Spotify 等知名企业。
一般的软件他人仅可取得已经编译过的二进制可执行档,只有软件的作者或著作权所有者等拥有程序的源代码,这类软件称为闭源软件。
开源软件不仅仅是源代码公开,更重要的是其他人可以在开源协议的规定内对软件进行学习,修改以及出于任何目的的再分发。
开放源代码的定义最先由 Bruce Perens 提出,经由 Eric S.Raymond 发展,主要有以下十条:
1999 年,Eric S.Raymond 出版了著作《大教堂与市集》,该书讲述了黑客文化史、Linux的开发过程、以及作者本人主持开发的开放源代码软件 Fetchmail 的经历,并讨论了软件开发的方法论。《大教堂与市集》成为开放源代码活动的圣经。
*Eric S.Raymond
与“教堂式”对应的,开源软件开发模式被称为“市集式”,就是通过不同的软件开发爱好者,组成一个不同流程和不同方式的市集,共同开发软件。
市集式的代表便是 Linux,最初由芬兰大二学生 Linus Torvalds 于 1991 年首次发布 Linux 的内核,后来无数人加入合作使其可用性增强。现如今,采用 Linux 内核的系统已经运行在很多的设备上,比如大型计算机和超级计算机、服务器、手机(安卓)、路由器、电视等等。
*杨立昆Yann LeCun
开源的缺点
在前面,老狐介绍的都是开源的优点,事实上,开源的缺点某种程度上也是其优点带来的,体现了一个事物的两面性。
首先是开源项目参与人数众多,且自发进行,这必然造成管理困难,需要项目领导者付出更多精力去整合项目,做好决策。
例如 80 年代与比尔·盖茨齐名的技术天才米切尔·卡普尔曾出资几百万美元启动一个名为 Chandler 的开源项目,旨在开发一个个人信息管理软件,但因为项目管理混乱,开发人员更迭,项目最后失败。
*米切尔·卡普尔
其次,开源项目迭代频繁,不断有新版本被开发出来,这需要软件用户不断安装新版本,这给用户带来了更高的使用成本。
最后则是开源软件未来的不确定性,因为其成员来自不同的人,软件的质量和未来发展都没法得到保证,一款软件用户正用着可能就没下文了。
以上开源的三个缺点恰好是闭源的商业软件的优势,以 Windows 为例,微软有专业团队负责开发,后期有稳定的更新和维护,能给用户减少许多的麻烦。
写在最后
读到这里,我想大家对“开源”已经有了大概的了解。
近些年,伴随着互联网的快速发展,尤其是大数据、物联网、AI 等技术的火热,开源软件的开发者逐渐增多,相关的开源项目也越来越多,促进了开源软件行业的发展。
一向封闭的微软,也在纳德拉上任后开始拥抱开源。2014 年,微软在开源社区 Github 上开设了账户,并成为社区的最大贡献者;2018 年,微软花费 75 亿美元收购了 Github,后者当时已是全球最大的开源社区和代码托管平台;如今,微软也将与 Meta 的 Llama 展开合作。
*纳德拉和扎克伯格
开源社区 Hugging Face 伴随着 AI 的兴起,成为了开源社区的顶流,如今 Hugging Face 上有超过 25 万个模型,包括 Meta 的 Llama 2、国内王小川创立的百川智能的大语言模型“百川”。
*Hugging Face上的大模型
现在回到文章开头的话题上来,小伙伴们认为 Llama 能通过开源的方式,击败闭源的 ChatGPT 和 Bard 么?
虽然结果老狐也无法预测,但非常乐意见到这样的竞争,这是一场技术落后者借助群众力量与技术领先者的竞争,也是开源的理想主义者与闭源的现实主义者的竞争,结果会怎样呢?
答案在时间里。
参考资料
财联社:Meta 发布 Llama 2 模型 与微软、高通展开合作
晚点 LastPost:Llama 2 发布,一夜之间,大模型竞争来到新起点
维基百科:“开放源代码”
石娟:开放源代码及相关知识产权法理刍论[D].重庆:西南政法大学,2007.
远川研究所:差一步称霸AI:历史进程中的扎克伯格
Web3 天空之城:杨立昆最新访谈:AI 威胁论是蒙昧主义,控制欲只有人才有
维基百科:《Dreaming in code》
虎嗅:Github 50 亿美元把自己卖了,为什么是微软呢?
极客公园:为了中国市场,Hugging Face 甚至玩上了小红书
编辑:木易
相关文章
猜你喜欢