Meta发布GPT“平替”Llama 2:开源、免费、可商用!

Meta 发布首个开源可商用大语言模型的 Llama 2

在上周 Meta 推出的 Threads 应用在与 Twitter 的对战中,以史上最快速度突破了 1 亿用户。


而今天,Meta 在大型语言模型方面则与微软联手,向谷歌和 OpenAI 发起了新的挑战。


在微软的 Inspire 合作伙伴大会上,Meta 宣布与微软深化合作,正式推出新一代开源大型语言模型 Llama 2,并将该模型免费开放给商业和研究使用。


Meta 高调开源 Llama 2,显示出其与走“技术保密路线”的 GPT-4 和谷歌的 PaLM 2 的正面竞争,试图打破 OpenAI 和谷歌正在努力构建的技术围墙。


Meta 表示,生态系统更加开放,将会带来更多进步。开源推动创新,让更多开发人员能够使用新技术进行开发,提高了技术的安全性。


Meta 发布首个开源可商用大语言模型的 Llama 2


根据 Meta 的官方数据,Llama 2 相较于上一代,训练数据提升了 40%,包含了 70 亿、 130 亿和 700 亿参数 3 个版本。


Llama 2 预训练模型接受了 2 万亿个 tokens 的训练,上下文长度是 Llama 1 的两倍,其微调模型已经接受了超过 100 万人人类注释的训练。


在训练流程方面,Llama 2 经历了预训练阶段(PT)、指令微调(SFT)以及人类反馈强化学习(RLHF)三个阶段,与 ChatGPT 类似。在包括推理、编码、熟练程度和知识测试等外部基准测试中,Llama 2 在许多方面都显著高于 MMLU 、 TriviaQA 等其他开源语言模型。


Meta 表示 Llama 2 可免费用于研究和商业用途,开发者们可以直接在 Llama 2 官方网站下载该模型。


为了避免此前 LLaMA 泄漏后带来的深度伪造和色情聊天机器人等不良信息和产品的出现,Llama 2 已经经过了红队测试,避免模型产出不良和有害内容,并且为开发者们制定了使用指南和守则。


在合作伙伴方面,Meta 还透露将与微软、亚马逊、 IBM 、 NVIDIA 、高通等科技公司合作开发 Llama 2。


其中,高通已宣布到 2024 年将能够在搭载 Snapdragon 的设备上运行 Llama 2。


而微软则宣布将可以在 Aure 上微调和部署 Llama 2,并将针对 Windows 上的本地操作进行优化。


Llama 2 的模型数据免费向公众开放,感兴趣的小伙伴可以在下页输入姓名和所属单位来请求下载。


Llama 2 不仅可以用于研究目的,还可以用于商业用途:

https://ai.meta.com/resources/models-and-libraries/llama-downloads/

本站文章均为原创,版权归本站所有,如需转载或引用请注明出处如:“本文章转载自:

Meta发布GPT“平替”Llama 2:开源、免费、可商用! - Extfans”

上一篇:侧边翻译插件,Chrome高质量且实用的翻译工具

下一篇:Do It!这款插件能让电影男主角变成一只桌面宠物