百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术文章 > 正文

在Ubuntu上安装部署LLaMA-Factory,及微调大模型测试

nanshan 2025-02-08 12:11 9 浏览 0 评论

LLaMA-Factory是一个非常好用的开源微调大模型工具。

GitHub:https://github.com/hiyouga/LLaMA-Factory

添加图片注释,不超过 140 字(可选)

添加图片注释,不超过 140 字(可选)

LLaMA-Factory介绍

项目特色

  • 多种模型:LLaMA、Mistral、Mixtral-MoE、Qwen、Yi、Gemma、Baichuan、ChatGLM、Phi 等等。
  • 集成方法:(增量)预训练、指令监督微调、奖励模型训练、PPO 训练、DPO 训练和 ORPO 训练。
  • 多种精度:32 比特全参数微调、16 比特冻结微调、16 比特 LoRA 微调和基于 AQLM/AWQ/GPTQ/LLM.int8 的 2/4/8 比特 QLoRA 微调。
  • 先进算法:GaLore、DoRA、LongLoRA、LLaMA Pro、LoRA+、LoftQ 和 Agent 微调。
  • 实用技巧:FlashAttention-2、Unsloth、RoPE scaling、NEFTune 和 rsLoRA。
  • 实验监控:LlamaBoard、TensorBoard、Wandb、MLflow 等等。
  • 极速推理:基于 vLLM 的 OpenAI 风格 API、浏览器界面和命令行接口。

性能指标

与 ChatGLM 官方的 P-Tuning 微调相比,LLaMA Factory 的 LoRA 微调提供了 3.7 倍的加速比,同时在广告文案生成任务上取得了更高的 Rouge 分数。结合 4 比特量化技术,LLaMA Factory 的 QLoRA 微调进一步降低了 GPU 显存消耗。


添加图片注释,不超过 140 字(可选)



支持的模型

模型名

模型大小

默认模块

Template

Baichuan2

7B/13B

W_pack

baichuan2

BLOOM

560M/1.1B/1.7B/3B/7.1B/176B

query_key_value

-

BLOOMZ

560M/1.1B/1.7B/3B/7.1B/176B

query_key_value

-

ChatGLM3

6B

query_key_value

chatglm3

DeepSeek (MoE)

7B/16B/67B

q_proj,v_proj

deepseek

Falcon

7B/40B/180B

query_key_value

falcon

Gemma

2B/7B

q_proj,v_proj

gemma

InternLM2

7B/20B

wqkv

intern2

LLaMA

7B/13B/33B/65B

q_proj,v_proj

-

LLaMA-2

7B/13B/70B

q_proj,v_proj

llama2

Mistral/Mixtral

7B/8x7B

q_proj,v_proj

mistral

OLMo

1B/7B

att_proj

olmo

Phi-1.5/2

1.3B/2.7B

q_proj,v_proj

-

Qwen

1.8B/7B/14B/72B

c_attn

qwen

Qwen1.5 (MoE)

0.5B/1.8B/4B/7B/14B/32B/72B

q_proj,v_proj

qwen

StarCoder2

3B/7B/15B

q_proj,v_proj

-

XVERSE

7B/13B/65B

q_proj,v_proj

xverse

Yi

6B/9B/34B

q_proj,v_proj

yi

Yuan

2B/51B/102B

q_proj,v_proj

yuan

Note 默认模块应作为 --lora_target 参数的默认值,可使用 --lora_target all 参数指定全部模块。 对于所有“基座”(Base)模型,--template 参数可以是 default, alpaca, vicuna 等任意值。但“对话”(Chat)模型请务必使用对应的模板

项目所支持模型的完整列表请参阅 constants.py。

您也可以在 template.py 中添加自己的对话模板。

训练方法

方法

全参数训练

部分参数训练

LoRA

QLoRA

预训练

?

?

?

?

指令监督微调

?

?

?

?

奖励模型训练

?

?

?

?

PPO 训练

?

?

?

?

DPO 训练

?

?

?

?

ORPO 训练

?

?

?

?

数据集

预训练数据集指令微调数据集偏好数据集

部分数据集的使用需要确认,我们推荐使用下述命令登录您的 Hugging Face 账户。

pip install --upgrade huggingface_hub
huggingface-cli login

软硬件依赖

必需项

至少

推荐

python

3.8

3.10

torch

1.13.1

2.2.0

transformers

4.37.2

4.39.3

datasets

2.14.3

2.18.0

accelerate

0.27.2

0.28.0

peft

0.9.0

0.10.0

trl

0.8.1

0.8.1

可选项

至少

推荐

CUDA

11.6

12.2

deepspeed

0.10.0

0.14.0

bitsandbytes

0.39.0

0.43.0

flash-attn

2.3.0

2.5.6

硬件依赖

* 估算值

训练方法

精度

7B

13B

30B

70B

8x7B

全参数

AMP

120GB

240GB

600GB

1200GB

900GB

全参数

16

60GB

120GB

300GB

600GB

400GB

GaLore

16

16GB

32GB

64GB

160GB

120GB

部分参数

16

20GB

40GB

80GB

200GB

160GB

LoRA

16

16GB

32GB

64GB

160GB

120GB

QLoRA

8

10GB

20GB

40GB

80GB

60GB

QLoRA

4

6GB

12GB

24GB

48GB

30GB

QLoRA

2

4GB

8GB

16GB

24GB

18GB

安装过程

安装依赖

按照GitHub上介绍的过程安装即可,为了加快速度,增加了国内的pip 源。

git clone https://github.com/hiyouga/LLaMA-Factory.git
conda create -n llama_factory python=3.10
conda activate llama_factory
cd LLaMA-Factory
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple -e .[metrics]

可选的额外依赖项:deepspeed、metrics、unsloth、galore、vllm、bitsandbytes、gptq、awq、aqlm、qwen、quality

LLaMA Board 可视化界面

注意:LLaMA Board 可视化界面目前仅支持单 GPU 训练,请使用命令行接口来进行分布式训练。

使用本地环境:

export CUDA_VISIBLE_DEVICES=0 # Windows 使用 `set CUDA_VISIBLE_DEVICES=0`

python src/train_web.py # 或 python -m llmtuner.webui.interface

执行后:

添加图片注释,不超过 140 字(可选)

然后就可以访问web界面了:

添加图片注释,不超过 140 字(可选)

数据准备

可以使用 HuggingFace / ModelScope 上的数据集或加载本地数据集。使用自定义数据集时,请更新 data/dataset_info.json 文件。


效果测试(持续更新)

准备训练几个QWen1.5的模型试一下,从0.5B的开始。

QWen1.5-0.5B + Example

速度非常快。看了一下数据,就2条,怪不得快

添加图片注释,不超过 140 字(可选)

QWen1.5-0.5B + alpach_gpt4_zh训练Lora

这个有48818条记录,数据格式如下:

添加图片注释,不超过 140 字(可选)

训练设置如下:

添加图片注释,不超过 140 字(可选)

看后端提示,在对数据处理后就开始训练了:

添加图片注释,不超过 140 字(可选)

添加图片注释,不超过 140 字(可选)

前端可以看见训练进度:

添加图片注释,不超过 140 字(可选)

0.5B的模型,可是训练起来需要的时间也不少。

添加图片注释,不超过 140 字(可选)

在T4 GPU上训练了4个小时结束

添加图片注释,不超过 140 字(可选)

训练结果在:LLaMA-Factory/saves目录下。

QWen1.5-0.5B + alpach_gpt4_zh全量

添加图片注释,不超过 140 字(可选)

预估时间8小时多,是Lora模式的一倍:

添加图片注释,不超过 140 字(可选)

添加图片注释,不超过 140 字(可选)

QWen1.5-0.5B + alpach_gpt4_zh freeze

添加图片注释,不超过 140 字(可选)

预估时间也是4个多小时:

添加图片注释,不超过 140 字(可选)

添加图片注释,不超过 140 字(可选)

内存占用:

添加图片注释,不超过 140 字(可选)

比全量的少一些。

相关推荐

三种自建KMS激活系统自动激活windows方法

第一种:在windows服务器上搭建主要针对vol版本(win7、win10、win20xx、win2012等等)平台:我自己搭建的windows虚拟机,windows2016的操作系统软件:...

重装系统被收98元?避开Windows付费陷阱的实用指南

重装系统被收98元?避开Windows付费陷阱的实用指南有网友反映,在重装Windows系统后,屏幕突然弹出“激活系统需支付98元服务费”的提示,疑惑自己是不是遭遇了付费陷阱。事实上,微软官方的Wi...

Windows Server2012远程桌面服务配置和授权激活

安装:注意:安装完毕之后需手动重启一下计算机配置终端服务管理工具---远程桌面服务---RD授权诊断程序,查看当前服务器有没有授权授权:运行—>gpedit.msc->计算机配置---管理...

新书速览|Windows Server 2022 系统与网站配置实战

讲述桌面体验、ServerCore/NanoServer,容器与云系统的配置1本书内容《WindowsServer2022系统与网站配置实战》秉持作者一贯理论兼具实践的写作风格,以新版的Wi...

Windows激活全攻略:KMS神钥与专业工具的完美结合!

对于许多Windows用户来说,系统的激活是一个必经的过程。虽然Windows操作系统在未经激活的状态下也可以使用一段时间,但长期来看,未激活的系统会限制某些功能并频繁提示用户激活。以下是两种流行的激...

微软Win9全新激活技术曝光(微软系统激活有什么用)

2014-07-0905:46:00作者:徐日俄罗斯Wzor日前披露了更多关于Windows9的最新消息,据悉,Windows9将会在今年秋季亮相,其宣传口号是“想要开始按钮和开始菜单?如你所...

快速激活Windows 10/11:CMD命令详细教程

#记录我的2024#激活Windows操作系统是确保系统功能和安全更新正常运行的重要步骤。本文将为您分享如何使用命令提示符(CMD)在Windows10和Windows11上进行激活的详细步骤。...

Wndows 2019 RDS应用发布部署(rds的安装和应用程序的发布)

安装前的准备1、需要提供服务器作为应用中心,应用中心的推荐配置如下表所示。规格建议1-10人11-20人21-50人51-100人100+人CPU4核8核16核内存8GB16GB32GB64GB系统盘...

解决 Windows 系统激活难题(如何解决windows激活问题)

今天,一位朋友给我说,他手头有三台电脑,均同时弹出系统未激活的提示。他对此毫无头绪,便急忙将电脑上出现的激活提示信息一股脑发给了我。我看到其中一台显示的是“Windows10企业版LTSC尚...

自建KMS激活服务器(自建kms激活服务器的风险)

自建KMS激活服务器Win10和office安装后,都需要激活才可以使用,一般可以输入购买的MAK激活码进行在线激活,也可以通过KMS激活,网上也有很多激活工具,但这些工具一般都含有病毒或木马程序,容...

30秒免费激活windows和office亲测有效!

“第三方工具有病毒?”“KMS服务器激活总失效?”今天给大家分享一个开源激活工具——MicrosoftActivationScripts(MAS),无需密钥、不装软件,30秒永久激活Window...

「操作系统」Windows 10 LTSC 2019 企业版C大集成更新版

Windows10LTSC企业版CHIANNET集成更新优化整合多镜像版,CHIANNET,是USBOS超级PE维护盘工具箱作者,长久以来一直默默的更新着,USBOSPE软件,电脑城装机及...

一文看懂Windows激活:自查方法+授权类型科普(Win7/Win10通用)

一、如何判断Windows是否永久激活?无论是Win7还是Win10,均可通过以下方法快速验证:命令提示符法(通用):按下Win+R,输入slmgr.vbs/xpr并按回车键运行即可查看是否...

部分Windows Server 2019/2022用户反馈无法运行微软Teams应用

IT之家7月2日消息,科技媒体borncity今天(7月2日)发布博文,报道称在多个WindowsServer版本上,MicrosoftTeams应用近期出现了运行故障。用...

这种Windows激活方式已有20年...(windows现在激活)

2006年微软正式发布WindowsVista,随之而来引入了一项新的激活机制「OEM激活」,这项机制在Vista和Win7上最为流行。其实WindowsServer自2008开始至2025版本一...

取消回复欢迎 发表评论: