ChatGLM 高效微调 ChatGLM-Efficient-Tuning

⭐⭐⭐☆☆ (3/5) 🧩 软硬件结合 已发布
hiyouga 1856 Stars 未知 BOM 完整度: /5 教程完整度: /5

项目简介

Fine-tuning ChatGLM-6B with PEFT | 基于 PEFT 的高效 ChatGLM 微调


Fine-tuning ChatGLM-6B with PEFT | 基于 PEFT 的高效 ChatGLM 微调

标签

项目特点

支持多种高效微调方法:LoRA、P-Tuning V2、Freeze 和全量微调
支持监督微调(SFT)、奖励模型训练(RM)和 RLHF
提供 Web UI、API 和 CLI 等多种交互方式
支持 4/8 位量化训练(QLoRA)
支持多数据集联合训练
支持从检查点恢复训练
支持模型权重合并
兼容 ChatGLM2-6B 模型

技术规格

基础模型
微调方法
训练阶段
量化支持
Python 版本
PyTorch 版本
依赖库
最低显存

项目资源

物料清单 (BOM)

物料名称 数量 参考价格 备注
Python 3.8+ 1 运行环境
PyTorch 1.13.1+ 1 深度学习框架
CUDA 1 GPU 加速
GPU (24GB+ 显存) 1 推荐 NVIDIA 显卡
ChatGLM-6B 权重 1 需从 Hugging Face 下载

所需工具

工具用途是否必需
GPU (24GB+ 显存) 模型训练和推理 ✅ 是
Python 环境 运行脚本 ✅ 是
Git LFS 下载模型权重 ✅ 是
Hugging Face 账号 访问部分数据集 ▢ 推荐

能力画像

记忆与知识检索
1/5
逻辑推演
3/5
表达与交流
1/5
感知与观察
1/5
数理与计算
4/5
动手与操作
3/5
狂热与坚持
4/5
创造与创新
3/5

所需技能

🔧 **动手能力**:需要配置 Python 环境、安装依赖、下载模型权重,具备基本的命令行操作能力 💻 **编程能力**:需要理解 Python 脚本和命令行参数,能够调整训练配置,了解深度学习基本概念 ⚡ **电子电路**:不需要

适用场景

对 ChatGLM-6B 模型进行领域特定微调,如医疗、法律、金融等垂直领域
使用 RLHF 技术优化模型输出,使其更符合人类偏好
在资源受限的环境下通过 LoRA 等高效微调方法进行模型适配
研究和实验不同的微调方法对模型性能的影响