OneTrainer
OneTrainer
⭐⭐⭐☆☆ (3/5)
🧩 软硬件结合
已发布
项目简介
OneTrainer is a one-stop solution for all your Diffusion training needs.
OneTrainer 是一款专为 Diffusion 模型训练打造的一站式解决方案,旨在简化从数据准备到模型微调的全流程。无论你是想对 Stable Diffusion 系列(1.5、2.0、2.1、3.0、3.5、SDXL)、FLUX.1/2、PixArt、Sana、Hunyuan Video 等主流模型进行全量微调、LoRA 还是 Embeddings 训练,OneTrainer 都能提供直观且强大的支持。
标签
项目特点
**多模型支持**:支持 Ernie Image、FLUX.1、Stable Diffusion 1.5/2.0/2.1/3.0/3.5、SDXL、PixArt、Hunyuan Video 等多种主流扩散模型及修补模型。
**多种训练方法**:提供全量微调、LoRA、嵌入(Embeddings)三种训练方式。
**掩码训练**:支持仅对样本的特定部分进行训练,提高训练针对性。
**自动备份**:训练过程中定期自动备份全部进度,支持无缝恢复训练。
**图像增强**:对每个图像样本随机应用旋转、亮度、对比度、饱和度等变换,快速创建更多样化的数据集。
**TensorBoard 集成**:内置 TensorBoard 集成,方便跟踪训练进度。
**多提示训练**:支持对每个图像样本使用多个不同的提示进行训练。
**噪声调度器重缩放**:实现了论文《Common Diffusion Noise Schedules and Sample Steps are Flawed》中的方法。
**EMA 训练**:支持训练自己的 EMA 模型,并可将 EMA 权重保留在 CPU 内存中以减少 VRAM 使用。
**宽高比分桶**:自动同时训练多种宽高比,只需选择目标分辨率,系统自动创建分桶。
**多分辨率训练**:同时训练多个分辨率。
**数据集工具**:使用 BLIP、BLIP2、WD-1.4 自动为数据集添加标注,或使用 ClipSeg、Rembg 创建掩码。
**模型工具**:通过简单 UI 在不同模型格式之间转换。
**采样 UI**:训练期间无需切换应用即可对模型进行采样。
技术规格
| 支持模型 | |
|---|---|
| 模型格式 | |
| 训练方法 | |
| 运行环境 | |
| 操作系统 |
项目资源
物料清单 (BOM)
| 物料名称 | 数量 | 参考价格 | 备注 |
|---|---|---|---|
| Python | 1 | — | >=3.10 且 <3.14 |
| Git | 1 | — | 用于克隆仓库和更新 |
| 计算机 | 1 | — | 建议配备 NVIDIA GPU(用于训练) |
所需工具
| 工具 | 用途 | 是否必需 |
|---|---|---|
| Python | 运行 OneTrainer | ✅ 是 |
| Git | 克隆和更新项目 | ✅ 是 |
| 文本编辑器/IDE | 查看和编辑配置文件 | ▢ 推荐 |
| TensorBoard | 可视化训练进度 | ▢ 推荐 |
能力画像
记忆与知识检索
2/5
逻辑推演
3/5
表达与交流
1/5
感知与观察
1/5
数理与计算
4/5
动手与操作
3/5
狂热与坚持
3/5
创造与创新
3/5
项目图库
所需技能
🔧 **动手能力**:需要能够安装 Python 和 Git,运行批处理或 shell 脚本,以及基本的命令行操作。
💻 **编程能力**:需要一定的 Python 基础,能够理解虚拟环境、依赖安装等概念。了解 PyTorch 和扩散模型原理有助于更好地使用。
⚡ **电子电路**:不涉及。
适用场景
**AI 模型微调**:对 Stable Diffusion 等扩散模型进行个性化微调或 LoRA 训练。
**学术研究**:用于实验不同的训练方法、噪声调度器或模型架构。
**内容创作**:训练自定义的文本到图像模型,生成特定风格或主题的图像。
**数据集处理**:利用内置工具对图像数据集进行自动标注、掩码生成和增强。