开源大模型食用指南 self-llm

⭐⭐⭐☆☆ (3/5) 🧩 软硬件结合 已发布
datawhalechina 12024 Stars 未知 BOM 完整度: /5 教程完整度: /5

项目简介

《开源大模型食用指南》针对中国宝宝量身打造的基于Linux环境快速微调(全参数/Lora)、部署国内外开源大模型(LLM)/多模态大模型(MLLM)教程


《开源大模型食用指南》针对中国宝宝量身打造的基于Linux环境快速微调(全参数/Lora)、部署国内外开源大模型(LLM)/多模态大模型(MLLM)教程

标签

项目特点

**全流程覆盖**:从环境配置、模型部署到高效微调,提供完整的端到端教程。
**模型丰富**:已支持 50+ 国内外主流开源大语言模型,并持续更新。
**国产硬件友好**:提供 AMD GPU、昇腾 Ascend NPU 等平台的专属配置与部署指南。
**面向初学者**:教程语言通俗易懂,步骤详细,适合零基础入门。
**社区驱动**:鼓励用户通过 Issue 和 PR 参与贡献,共同完善项目。

技术规格

支持模型
支持平台
微调方法
部署方式
学习路径

项目资源

物料清单 (BOM)

物料名称 数量 参考价格 备注
Linux 服务器/个人电脑 1 推荐配备 NVIDIA GPU
网络连接 1 用于下载模型和依赖
Python 3.8+ 1 编程环境
PyTorch 1 深度学习框架
CUDA/CuDNN 1 GPU 加速(如使用 NVIDIA GPU)
Transformers, vLLM, XTuner 等 1 模型加载与微调工具

所需工具

工具用途是否必需
Linux 操作系统 运行环境和模型部署 ✅ 是
Python 编程环境 执行脚本和模型推理 ✅ 是
GPU (NVIDIA/AMD/昇腾) 加速模型训练和推理 ▢ 推荐
Git 克隆仓库和版本管理 ✅ 是

能力画像

记忆与知识检索
2/5
逻辑推演
3/5
表达与交流
2/5
感知与观察
1/5
数理与计算
3/5
动手与操作
4/5
狂热与坚持
3/5
创造与创新
3/5

所需技能

🔧 **动手能力**:需要能够搭建 Linux 环境,安装配置 Python、CUDA 等依赖,并执行命令行操作。 💻 **编程能力**:需要具备基础的 Python 编程能力,能够理解和使用深度学习框架(如 PyTorch)。 ⚡ **电子电路**:无需电子电路知识。

适用场景

学生和研究者希望学习并上手开源大模型。
开发者需要本地部署和微调大模型以构建特定应用。
对国产硬件(如昇腾、AMD)上的大模型部署感兴趣的用户。
希望低成本、长期使用大模型的个人或团队。