LLM微调项目 - iMakething

项目简介

LLM Finetuning with peft

LLM-Finetuning 是一个专注于大语言模型高效微调的开源项目，旨在帮助开发者和研究者以更低的计算成本完成模型定制。项目基于 PEFT（参数高效微调）技术栈，深度融合 LoRA、QLoRA 等前沿方法，并依托 Hugging Face 的 transformers 库，提供了一套从理论到实践的完整微调方案。

项目特点

提供20+个完整的 Colab 笔记本教程，覆盖多种 LLM 微调技术

支持 LoRA、QLoRA、PEFT、RLHF 等多种高效微调方法

涵盖 Llama 2、Falcon-7b、Mistral-7b、GPT-NeoX-20B 等多种主流模型

包含 RAG 和知识图谱构建等高级应用教程

所有教程均可直接在 Google Colab 中运行，无需本地 GPU

从基础微调到高级量化训练，适合不同水平的用户

技术规格

框架	Hugging Face Transformers, PEFT, TRL
微调方法	LoRA, QLoRA, RLHF, SFT
支持模型	Llama 2, Falcon-7b, Mistral-7b, GPT-NeoX-20B, MPT-30B, Phi-1.5, GPT-3.5 Turbo 等
运行环境	Google Colab (免费)
编程语言	Python
量化支持	8-bit, 4-bit, 2-bit, 1-bit (HQQ)
额外工具	LangChain, Neo4j, AutoTrain

项目资源

GitHub 仓库 1. Efficiently Train Large Language Models with LoRA and Hugging Face 2. Fine-Tune Your Own Llama 2 Model in a Colab Notebook 3. Guanaco Chatbot Demo with LLaMA-7B Model 4. PEFT Finetune-Bloom-560m-tagger 5. Finetune_Meta_OPT-6-1b_Model_bnb_peft 6. Finetune Falcon-7b with BNB Self Supervised Training 7. FineTune LLaMa2 with QLoRa 8. Stable_Vicuna13B_8bit_in_Colab 9. GPT-Neo-X-20B-bnb2bit_training 10. MPT-Instruct-30B Model Training 11. RLHF_Training_for_CustomDataset_for_AnyModel 12. Fine_tuning_Microsoft_Phi_1_5b_on_custom_dataset(dialogstudio) 13. Finetuning OpenAI GPT3.5 Turbo 14. Finetuning Mistral-7b FineTuning Model using Autotrain-advanced 15. RAG LangChain Tutorial 16. Knowledge Graph LLM with LangChain PDF Question Answering 17. Text to Knowledge Graph with OpenAI Function with Neo4j and Langchain Agent Question Answering 18. Convert the Document to Knowledgegraph using Langchain and Openai 19. How to train a 1-bit Model with LLMs? 20. Alpaca_+_Gemma2_9b_Unsloth_2x_faster_finetuning

搜索资源

百度必应搜狗 Google DuckDuckGo GitHub Gitee B站 YouTube 知乎小红书微信 CSDN Hackster Hackaday Printables Instructables OSHWHub

物料清单 (BOM)

物料名称	数量	参考价格	备注
Google Colab 账号	1	—	免费，用于运行笔记本
Hugging Face 账号	1	—	可选，用于下载模型和上传结果
OpenAI API Key	1	—	仅用于 GPT-3.5 Turbo 微调教程
Neo4j 数据库	1	—	仅用于知识图谱相关教程

能力画像

⚪ 记忆与知识检索: 3/5

🔵 逻辑推演: 4/5

⚪ 表达与交流: 2/5

⚪ 感知与观察: 1/5

⚪ 数理与计算: 4/5

⚪ 动手与操作: 2/5

⚪ 狂热与坚持: 3/5

⚪ 创造与创新: 4/5

项目图库

所需技能

🔧 **动手能力**：无需硬件操作，但需要熟悉在 Colab 中运行代码和调试错误。 💻 **编程能力**：需要 Python 编程基础，了解 PyTorch 和 Hugging Face 库的基本使用。 ⚡ **电子电路**：不涉及电子电路知识。

适用场景

学习如何使用 LoRA 和 PEFT 技术高效微调大型语言模型

快速上手 Llama 2、Falcon、Mistral 等主流开源模型的微调

探索 RLHF、RAG、知识图谱等高级 LLM 应用技术

在有限计算资源下（免费 Colab）进行 LLM 微调实验

为特定任务（如对话、问答、文本生成）定制 LLM 模型

LLM微调项目 `LLM-Finetuning`

项目简介

标签

项目特点

技术规格

项目资源

搜索资源

物料清单 (BOM)

能力画像

项目图库

所需技能

适用场景

LLM微调项目 LLM-Finetuning

项目简介

标签

项目特点

技术规格

项目资源

搜索资源

物料清单 (BOM)

能力画像

项目图库

所需技能

适用场景

LLM微调项目 `LLM-Finetuning`