快速玩转 Llama2！阿里云机器学习 PAI 推出最佳实践（一）——低代码 Lora 微调及部署

奋斗吧

擅长邻域：未填写

标签：快速玩转 Llama2！阿里云机器学习 PAI 推出最佳实践（一）——低代码 Lora 微调及部署数据可视化博客 51CTO博客

2023-07-26 18:24:24 484浏览

快速玩转 Llama2！阿里云机器学习 PAI 推出最佳实践（一）——低代码 Lora 微调及部署，本文基于阿里云机器学习PAI实现大语言模型Llama2低代码Lora微调及部署，适合想要快速开箱体验预训练模型的开发者

本文基于阿里云机器学习PAI实现大语言模型Llama2低代码 Lora 微调及部署，适合想要快速开箱体验预训练模型的开发者

前言

近期，Meta 宣布大语言模型 Llama2 开源，包含7B、13B、70B不同尺寸，分别对应70亿、130亿、700亿参数量，并在每个规格下都有专门适配对话场景的优化模型Llama-2-Chat。Llama2 可免费用于研究场景和商业用途（但月活超过7亿以上的企业需要申请），对企业和开发者来说，提供了大模型研究的最新利器。

目前，Llama-2-Chat在大多数评测指标上超过了其他开源对话模型，并和一些热门闭源模型（ChatGPT、PaLM）相差不大。阿里云机器学习平台PAI第一时间针对 Llama2 系列模型进行适配，推出全量微调、Lora微调、推理服务等场景最佳实践，助力AI开发者快速开箱。以下我们将分别展示具体使用步骤。

最佳实践一：Llama 2 低代码 Lora 微调及部署

本实践将采用阿里云机器学习平台PAI-快速开始模块针对 Llama-2-7b-chat 进行开发。PAI-快速开始支持基于开源模型的低代码训练、布署和推理全流程，适合想要快速开箱体验预训练模型的开发者。

一、准备工作

1、进入PAI-快速开始页面

a. 登入PAI控制台 <https://pai.console.aliyun.com/>

b. 进入PAI工作空间，并在左侧导航栏中找到“快速开始”。

快速玩转 Llama2！阿里云机器学习 PAI 推出最佳实践（一）——低代码 Lora 微调及部署_数据集

2、选择Llama2模型

PAI-快速开始包含了不同来源的许多热门开源模型，来支持人工智能的不同领域和任务。在本次实例中，请选择“生成式AI-大语言模型（large-language-model）”，进入模型列表页。

快速玩转 Llama2！阿里云机器学习 PAI 推出最佳实践（一）——低代码 Lora 微调及部署_机器学习_02

在模型列表页中您可以看到多个来自不同开源社区的主流模型。在本次展示中，我们将使用llama-2-7b-chat-hf模型（llama-2-7b-hf模型同理）。您也可以自由选择其他适合您当前业务需求的模型。

Tips：

一般来说，参数量越大的模型效果会更好，但相对应的模型运行时产生的费用和微调训练所需要的数据量都会更多。
Llama-2-13B和70B的版本，以及其他开源大语言模型也将后续在PAI-快速开始上线，敬请期待。

快速玩转 Llama2！阿里云机器学习 PAI 推出最佳实践（一）——低代码 Lora 微调及部署_语言模型_03

二、模型在线推理

快速开始提供的llama-2-7b-chat-hf来源于HuggingFace提供的Llama-2-7b-chat模型，它也是主要基于Transformer架构的大语言模型，使用多种混合的开源数据集进行训练，因此适合用于绝大多数的英文非专业领域场景。我们可以通过PAI快速开始将此模型直接部署到PAI-EAS，创建一个推理服务。

1、部署模型

通过模型详情页面的的部署入口您可以一键创建一个基于此模型的在线推理服务，所有的参数已经帮您默认配置完毕。当然，您也可以自由选择所使用的计算资源和其他设置，我们即可以将该模型直接部署到PAI-EAS创建推理服务。

请注意，模型需要至少64GiB内存和24GiB及以上的显存，请确保您选择的计算资源满足以上要求，否则部署可能失败。

快速玩转 Llama2！阿里云机器学习 PAI 推出最佳实践（一）——低代码 Lora 微调及部署_语言模型_04

通过服务详情页，您可以查看推理服务的部署状态。当服务状态为“运行中”时，表示推理服务已经部署成功。

快速玩转 Llama2！阿里云机器学习 PAI 推出最佳实践（一）——低代码 Lora 微调及部署_机器学习_05

Tips：

后续您可以随时在PAI-快速开始中点击“管理任务与部署”按钮来回到当前的推理服务。

2、调用推理服务

在部署成功之后，您即可通过WebUI的方式来最快速度调试您的服务，发送预测请求。

快速玩转 Llama2！阿里云机器学习 PAI 推出最佳实践（一）——低代码 Lora 微调及部署_数据集_06

快速玩转 Llama2！阿里云机器学习 PAI 推出最佳实践（一）——低代码 Lora 微调及部署_数据集_07

在WebUI中也同时支持了API调用能力，相关文档可以在WebUI页底点击“Use via API”查看。

三、模型微调训练

llama-2-7b-chat-hf模型适用于绝大多数非专业的场景。当您需要应用特定领域的专业知识时，您可以选择使用模型的微调训练来帮助模型在自定义领域的能力。

Tips：

大语言模型也可以在对话过程中直接学习到比较简单的知识，请根据自己的需求选择是否训练。
当前快速开始支持的训练方式基于LoRA。LoRA训练相较于其他训练方式（如SFT等）会显著降低训练成本和时间，但大语言模型的LoRA训练效果可能不稳定。

1、准备数据

Tips：

为方便您试用体验Llama 2模型，我们在 llama-2-7b-chat-hf的模型卡片中也已经帮您准备了一份默认用于Instruction Tuning的数据集来直接进行微调训练。

模型支持使用OSS上的数据进行训练。训练数据接受Json格式输入，每条数据由问题、答案、id组成，分别用"instruction"、"output"和"id"字段表示，例如：

[
    {
        "instruction": "以下文本是否属于世界主题？为什么美国人很少举行阅兵？",
        "output": "是",
        "id": 0
    },
    {
        "instruction": "以下文本是否属于世界主题？重磅！事业单位车改时间表已出！",
        "output": "不是",
        "id": 1
    }
]

训练数据的具体格式也可以在PAI-快速开始的具体模型介绍页中查阅。

关于如何上传数据到OSS，以及查看相应的数据，请参考OSS的帮助文档：<https://help.aliyun.com/document_detail/31883.html?spm=a2c4g.31848.0.0.71102cb7dsCgz2>

为了更好的验证模型训练的效果，除了提供训练数据集之外，也推荐您准备一份验证数据集：它将会用于在训练中评估模型训练的效果，以及训练的参数优化调整。