开源大模型食用指南

项目简介

《开源大模型食用指南》针对中国宝宝量身打造的基于Linux环境快速微调（全参数/Lora）、部署国内外开源大模型（LLM）/多模态大模型（MLLM）教程

项目特点

**全流程覆盖**：从环境配置、模型部署到高效微调，提供完整的端到端教程。

**模型丰富**：已支持 50+ 国内外主流开源大语言模型，并持续更新。

**国产硬件友好**：提供 AMD GPU、昇腾 Ascend NPU 等平台的专属配置与部署指南。

**面向初学者**：教程语言通俗易懂，步骤详细，适合零基础入门。

**社区驱动**：鼓励用户通过 Issue 和 PR 参与贡献，共同完善项目。

技术规格

支持模型	50+ 主流开源大语言模型（如 Qwen3, DeepSeek-R1, GLM-4, InternLM3, LLaMA4 等）
支持平台	Linux (主要), AMD GPU, 昇腾 Ascend NPU, Apple M 系列
微调方法	全量微调（分布式）、LoRA、ptuning
部署方式	命令行调用、在线 Demo、LangChain 框架集成
学习路径	环境配置 → 模型部署 → 模型微调

项目资源

GitHub 仓库支持模型列表与教程 AMD GPU 专区昇腾 Ascend NPU 专区 Apple M 专区 Happy-LLM 从零开始的大语言模型原理与实践教程 Tiny-Universe so-large-llm 动手学大模型应用开发

搜索资源

百度必应搜狗 Google DuckDuckGo GitHub Gitee B站 YouTube 知乎小红书微信 CSDN Hackster Hackaday Printables Instructables OSHWHub

物料清单 (BOM)

物料名称	数量	参考价格	备注
Linux 服务器/个人电脑	1	—	推荐配备 NVIDIA GPU
网络连接	1	—	用于下载模型和依赖
Python 3.8+	1	—	编程环境
PyTorch	1	—	深度学习框架
CUDA/CuDNN	1	—	GPU 加速（如使用 NVIDIA GPU）
Transformers, vLLM, XTuner 等	1	—	模型加载与微调工具

能力画像

⚪ 记忆与知识检索: 2/5

🔵 逻辑推演: 3/5

⚪ 表达与交流: 2/5

⚪ 感知与观察: 1/5

⚪ 数理与计算: 3/5

⚪ 动手与操作: 4/5

⚪ 狂热与坚持: 3/5

⚪ 创造与创新: 3/5

项目图库

所需技能

🔧 **动手能力**：需要能够搭建 Linux 环境，安装配置 Python、CUDA 等依赖，并执行命令行操作。 💻 **编程能力**：需要具备基础的 Python 编程能力，能够理解和使用深度学习框架（如 PyTorch）。 ⚡ **电子电路**：无需电子电路知识。

适用场景

学生和研究者希望学习并上手开源大模型。

开发者需要本地部署和微调大模型以构建特定应用。

对国产硬件（如昇腾、AMD）上的大模型部署感兴趣的用户。

希望低成本、长期使用大模型的个人或团队。

开源大模型食用指南 `self-llm`

项目简介

标签

项目特点

技术规格

项目资源

搜索资源

物料清单 (BOM)

能力画像

项目图库

所需技能

适用场景

开源大模型食用指南 self-llm

项目简介

标签

项目特点

技术规格

项目资源

搜索资源

物料清单 (BOM)

能力画像

项目图库

所需技能

适用场景

开源大模型食用指南 `self-llm`