ChatGLM-Tuning ChatGLM-Tuning

⭐⭐⭐☆☆ (3/5) 🧩 软硬件结合 已发布
mymusise 1752 Stars 未知 BOM 完整度: /5 教程完整度: /5

项目简介

基于ChatGLM-6B + LoRA的Fintune方案


基于ChatGLM-6B + LoRA的Fintune方案

标签

项目特点

基于 ChatGLM-6B 和 LoRA 进行参数高效微调,降低显存需求
支持 Alpaca 数据集,提供完整的数据预处理脚本
提供 Google Colab 示例,方便快速上手
支持 ChatGLM 和 ChatGLM2 两种模型版本
提供预训练好的 LoRA 权重,可直接用于推理
开源免费,社区活跃

技术规格

基础模型
微调方法
数据集
推荐显存
Python 版本
CUDA 版本
LoRA Rank
最大序列长度
训练精度

项目资源

物料清单 (BOM)

物料名称 数量 参考价格 备注
GPU (显存 >= 16GB) 1 建议 NVIDIA RTX 3090/4090 或 A100
Python >= 3.8 1 编程语言环境
CUDA >= 11.6 1 GPU 计算框架
bitsandbytes 0.41.2.post2 1 推荐版本,避免兼容性问题
Alpaca 数据集 1 从 Stanford Alpaca 仓库获取

所需工具

工具用途是否必需
GPU 服务器/云实例 运行模型训练和推理 ✅ 是
Python 开发环境 编写和运行代码 ✅ 是
Git 克隆项目仓库 ✅ 是
Google Colab (可选) 在线运行示例 ▢ 推荐

能力画像

记忆与知识检索
1/5
逻辑推演
3/5
表达与交流
1/5
感知与观察
1/5
数理与计算
4/5
动手与操作
3/5
狂热与坚持
3/5
创造与创新
4/5

所需技能

🔧 **动手能力**:需要配置深度学习环境(CUDA、Python包等),处理数据集,运行训练脚本 💻 **编程能力**:需要 Python 编程基础,理解深度学习训练流程,能够阅读和修改训练脚本 ⚡ **电子电路**:不涉及

适用场景

对 ChatGLM-6B 模型进行领域特定微调,提升特定任务表现
研究和实验参数高效微调(LoRA)技术
构建基于大语言模型的对话系统或问答系统
学术研究和教育场景中探索大模型微调方法