LLM微调项目
LLM-Finetuning
⭐⭐⭐☆☆ (3/5)
🧩 软硬件结合
已发布
项目简介
LLM Finetuning with peft
LLM-Finetuning 是一个专注于大语言模型高效微调的开源项目,旨在帮助开发者和研究者以更低的计算成本完成模型定制。项目基于 PEFT(参数高效微调)技术栈,深度融合 LoRA、QLoRA 等前沿方法,并依托 Hugging Face 的 transformers 库,提供了一套从理论到实践的完整微调方案。
标签
项目特点
提供20+个完整的 Colab 笔记本教程,覆盖多种 LLM 微调技术
支持 LoRA、QLoRA、PEFT、RLHF 等多种高效微调方法
涵盖 Llama 2、Falcon-7b、Mistral-7b、GPT-NeoX-20B 等多种主流模型
包含 RAG 和知识图谱构建等高级应用教程
所有教程均可直接在 Google Colab 中运行,无需本地 GPU
从基础微调到高级量化训练,适合不同水平的用户
技术规格
| 框架 | |
|---|---|
| 微调方法 | |
| 支持模型 | |
| 运行环境 | |
| 编程语言 | |
| 量化支持 | |
| 额外工具 |
项目资源
ashishpatel26/LLM-Finetuning
main/1.Efficiently_train_Large_Language_Models_with_LoRA_and_Hugging_Face.ipynb
main/2.Fine_Tune_Your_Own_Llama_2_Model_in_a_Colab_Notebook.ipynb
main/3.Guanaco%20Chatbot%20Demo%20with%20LLaMA-7B%20Model.ipynb
main/4.PEFT%20Finetune-Bloom-560m-tagger.ipynb
main/5.Finetune_Meta_OPT-6-1b_Model_bnb_peft.ipynb
main/6.Finetune%20Falcon-7b%20with%20BNB%20Self%20Supervised%20Training.ipynb
main/7.FineTune_LLAMA2_with_QLORA.ipynb
main/8.Stable_Vicuna13B_8bit_in_Colab.ipynb
main/9.GPT-neo-x-20B-bnb_4bit_training.ipynb
main/10.MPT_Instruct_30B.ipynb
main/11_RLHF_Training_for_CustomDataset_for_AnyModel.ipynb
main/12_Fine_tuning_Microsoft_Phi_1_5b_on_custom_dataset(dialogstudio
main/13.Fine_tuning_OpenAI_GPT_3_5_turbo.ipynb
main/14.Finetuning_Mistral_7b_Using_AutoTrain.ipynb
main/15.RAG_LangChain.ipynb
main/16.Neo4j_and_LangChain_for_Enhanced_Question_Answering.ipynb
main/17.OpenAI_Constructing_Graph_for_Questio_Answer.ipynb
main/18.Convert_Document_to_Knowledge_Graph_Langchain_Openai.ipynb
main/19.HQQ_1bit_ipynb.ipynb
main/20.Alpaca_+_Gemma2_9b_Unsloth_2x_faster_finetuning.ipynb
搜索资源
物料清单 (BOM)
| 物料名称 | 数量 | 参考价格 | 备注 |
|---|---|---|---|
| Google Colab 账号 | 1 | — | 免费,用于运行笔记本 |
| Hugging Face 账号 | 1 | — | 可选,用于下载模型和上传结果 |
| OpenAI API Key | 1 | — | 仅用于 GPT-3.5 Turbo 微调教程 |
| Neo4j 数据库 | 1 | — | 仅用于知识图谱相关教程 |
所需工具
| 工具 | 用途 | 是否必需 |
|---|---|---|
| Google Colab | 运行所有笔记本教程 | ✅ 是 |
| Python 3.8+ | 编程语言环境 | ✅ 是 |
| Hugging Face Transformers | 加载和微调模型 | ✅ 是 |
| PEFT 库 | 参数高效微调 | ✅ 是 |
| TRL 库 | RLHF 和 SFT 训练 | ▢ 推荐 |
| LangChain | RAG 和知识图谱构建 | ▢ 推荐 |
| Neo4j | 知识图谱数据库 | ▢ 推荐 |
| AutoTrain | 自动化微调 | ▢ 推荐 |
能力画像
记忆与知识检索
3/5
逻辑推演
4/5
表达与交流
2/5
感知与观察
1/5
数理与计算
4/5
动手与操作
2/5
狂热与坚持
3/5
创造与创新
4/5
项目图库
所需技能
🔧 **动手能力**:无需硬件操作,但需要熟悉在 Colab 中运行代码和调试错误。
💻 **编程能力**:需要 Python 编程基础,了解 PyTorch 和 Hugging Face 库的基本使用。
⚡ **电子电路**:不涉及电子电路知识。
适用场景
学习如何使用 LoRA 和 PEFT 技术高效微调大型语言模型
快速上手 Llama 2、Falcon、Mistral 等主流开源模型的微调
探索 RLHF、RAG、知识图谱等高级 LLM 应用技术
在有限计算资源下(免费 Colab)进行 LLM 微调实验
为特定任务(如对话、问答、文本生成)定制 LLM 模型