OneTrainer OneTrainer

⭐⭐⭐☆☆ (3/5) 🧩 软硬件结合 已发布
Nerogar 1184 Stars 未知 BOM 完整度: /5 教程完整度: /5

项目简介

OneTrainer is a one-stop solution for all your Diffusion training needs.


OneTrainer 是一款专为 Diffusion 模型训练打造的一站式解决方案,旨在简化从数据准备到模型微调的全流程。无论你是想对 Stable Diffusion 系列(1.5、2.0、2.1、3.0、3.5、SDXL)、FLUX.1/2、PixArt、Sana、Hunyuan Video 等主流模型进行全量微调、LoRA 还是 Embeddings 训练,OneTrainer 都能提供直观且强大的支持。

标签

项目特点

**多模型支持**:支持 Ernie Image、FLUX.1、Stable Diffusion 1.5/2.0/2.1/3.0/3.5、SDXL、PixArt、Hunyuan Video 等多种主流扩散模型及修补模型。
**多种训练方法**:提供全量微调、LoRA、嵌入(Embeddings)三种训练方式。
**掩码训练**:支持仅对样本的特定部分进行训练,提高训练针对性。
**自动备份**:训练过程中定期自动备份全部进度,支持无缝恢复训练。
**图像增强**:对每个图像样本随机应用旋转、亮度、对比度、饱和度等变换,快速创建更多样化的数据集。
**TensorBoard 集成**:内置 TensorBoard 集成,方便跟踪训练进度。
**多提示训练**:支持对每个图像样本使用多个不同的提示进行训练。
**噪声调度器重缩放**:实现了论文《Common Diffusion Noise Schedules and Sample Steps are Flawed》中的方法。
**EMA 训练**:支持训练自己的 EMA 模型,并可将 EMA 权重保留在 CPU 内存中以减少 VRAM 使用。
**宽高比分桶**:自动同时训练多种宽高比,只需选择目标分辨率,系统自动创建分桶。
**多分辨率训练**:同时训练多个分辨率。
**数据集工具**:使用 BLIP、BLIP2、WD-1.4 自动为数据集添加标注,或使用 ClipSeg、Rembg 创建掩码。
**模型工具**:通过简单 UI 在不同模型格式之间转换。
**采样 UI**:训练期间无需切换应用即可对模型进行采样。

技术规格

支持模型
模型格式
训练方法
运行环境
操作系统

项目资源

物料清单 (BOM)

物料名称 数量 参考价格 备注
Python 1 >=3.10 且 <3.14
Git 1 用于克隆仓库和更新
计算机 1 建议配备 NVIDIA GPU(用于训练)

所需工具

工具用途是否必需
Python 运行 OneTrainer ✅ 是
Git 克隆和更新项目 ✅ 是
文本编辑器/IDE 查看和编辑配置文件 ▢ 推荐
TensorBoard 可视化训练进度 ▢ 推荐

能力画像

记忆与知识检索
2/5
逻辑推演
3/5
表达与交流
1/5
感知与观察
1/5
数理与计算
4/5
动手与操作
3/5
狂热与坚持
3/5
创造与创新
3/5

所需技能

🔧 **动手能力**:需要能够安装 Python 和 Git,运行批处理或 shell 脚本,以及基本的命令行操作。 💻 **编程能力**:需要一定的 Python 基础,能够理解虚拟环境、依赖安装等概念。了解 PyTorch 和扩散模型原理有助于更好地使用。 ⚡ **电子电路**:不涉及。

适用场景

**AI 模型微调**:对 Stable Diffusion 等扩散模型进行个性化微调或 LoRA 训练。
**学术研究**:用于实验不同的训练方法、噪声调度器或模型架构。
**内容创作**:训练自定义的文本到图像模型,生成特定风格或主题的图像。
**数据集处理**:利用内置工具对图像数据集进行自动标注、掩码生成和增强。