编辑:编辑部
【新智元导读】史上最强开源代码工具Code Llama上线了,Llama-2唯一的编程短板被补平,34B参数的模型已接近GPT-4。凭借开源Llama杀疯的Meta,今天又放大招了!
专用编程版的Code Llama正式开源上线,可以免费商用和研究。
Code Llama的横空出世,标志着AI在编程中的重大飞跃,人人都可以利用这个模型进行复杂精确的编程开发任务。
另外,值得一提的,Perplexity的聊天工具,现在就可以用上Code Llama了。
快来一试:
https://labs.perplexity.ai/?utm_content=first_codellama&s=u&utm_source=twitter&utm_campaign=labs
它可以根据代码和自然语言提示(比如「编写一个输出斐波那契数列的函数」)生成代码和与代码有关的自然语言描述。
它还可以用于代码补全和Debug,支持当今最流行的编程语言,包括Python、C 、Java、PHP、Typescript(Javascript)、C#和Bash。
此外,Meta还进一步微调了Code Llama的两个子版本:
Code Llama - Python和Code Llama - Instruct。
Code Llama - Python是用Code Llama在100B的Python代码token上进一步微调的产物。
由于Python是代码生成任务中最常用的语言,并且Python和PyTorch在AI社区中具有举足轻重的地位,专门训练一个能对Python提供更好支持的模型能够大大增强模型的实用性。
而Code Llama - Instruct则是经过指令微调和对齐的Code Llama。
Meta将「自然语言指令」喂给了模型,并且给出了期望的输出。这个过程使得模型更擅长理解人类提示的预期结果。
Meta建议在使用Code Llama-Instruct进行代码生成任务,因为Code Llama - Instruct经过微调后,可以生成更加有用且更加安全的自然语言回复。
Meta不建议直接使用Code Llama或Code Llama - Python来执行一般的自然语言任务,因为这两个模型的设计初衷都不是遵循自然语言指令。
而且Code Llama也只专门用于代码相关的任务,不适合作为其他任务的基础模型。
模型下载
要下载模型权重和标记器,请访问Meta AI网站并接受许可。
一旦请求被批准,将会在电子邮件收到一个URL。然后运行download.sh脚本,在提示开始下载时传递提供的URL。确保复制URL文本,不要使用右键单击URL时的「复制链接地址」选项。
如果复制的URL文本以:https://download.llamameta.net开头,则复制正确。如果复制的URL文本以:https://l.facebook.com开头,则复制错误。
先决条件:确保你已安装wget和md5sum。然后运行脚本:bash download.sh。
请记住,链接会在24小时和一定数量的下载后过期。如果你开始看到诸如403: Forbidden之类的错误,你可以随时重新请求链接。
设置
在具有PyTorch/CUDA可用的conda环境中,克隆repo并在顶级目录中运行:
pip install -e .
推理
不同的模型需要不同的MP值:
以下是使用最新的llama.cpp在M2 Ultra上对Code Llama不同参数大小模型进行推理的一些数据。
参考资料:
https://ai.meta.com/blog/code-llama-large-language-model-coding/
相关文章
猜你喜欢