labelme labelme

⭐⭐⭐☆☆ (3/5) 🧩 软硬件结合 已发布
wkentaro 14728 Stars 未知 BOM 完整度: /5 教程完整度: /5

项目简介

Image annotation with Python. Supports polygon, rectangle, circle, line, point, and AI-assisted annotation.


Labelme 是一款基于 Python 开发的图形化图像标注工具,其设计灵感源自 MIT 的 LabelMe 项目。它使用 Qt 构建图形界面,旨在为计算机视觉任务提供高效、灵活且跨平台的标注解决方案。该工具解决了研究人员和开发者在进行图像分割、目标检测、分类等任务时,缺乏一个直观、易用且功能全面的标注平台的问题。通过 Labelme,用户可以轻松地为图像中的物体创建多边形、矩形、圆形、线条和点等多种形状的标注,并支持为图像添加分类标签和清理标记。其核心功能不仅限于静态图像,还扩展到了视频标注领域,能够处理时序数据。技术栈方面,Labelme 完全基于 Python 生态,利用 Qt 框架实现跨平台的图形界面,并支持通过 pip 进行快速安装,同时也提供了独立的可执行文件,方便不熟悉 Python 环境的用户使用。项目的一大亮点是其对 AI 辅助标注的支持,集成了 SAM、EfficientSAM 等模型,能够实现从点到多边形或遮罩的智能生成,以及通过 YOLO-world 和 SAM3 模型进行文本到标注的转换,极大提升了标注效率。此外,Labelme 支持超过 20 种语言的界面,包括中文、日文、韩文等,并允许用户自定义标签列表、自动保存和标签验证等 GUI 行为。它能够将标注结果导出为 VOC 格式(用于语义/实例分割)和 COCO 格式(用于实例分割),无缝对接主流深度学习框架的数据处理流程。无论是用于学术研究中的数据集构建,还是工业应用中的模型训练数据准备,Labelme 都是一个强大且广受欢迎的开源选择。

标签

项目特点

支持多边形、矩形、圆形、线条、点等多种标注形状
支持图像分类和清洗的标记(flag)功能
支持视频标注
支持 GUI 自定义(预定义标签/标记、自动保存、标签验证等)
支持导出 VOC 格式数据集(语义分割、实例分割)
支持导出 COCO 格式数据集(实例分割)
集成 AI 辅助标注:SAM、EfficientSAM 实现点转多边形/掩码
集成 AI 文本转标注:YOLO-world、SAM3 模型
支持 20 种语言界面(英文、中文、日文、韩文等)

技术规格

编程语言
图形界面框架
标注格式
导出格式
AI 模型支持
支持操作系统
安装方式
许可证

项目资源

物料清单 (BOM)

物料名称 数量 参考价格 备注
Python 1 运行环境
Qt (PyQt5/PySide2) 1 图形界面依赖
labelme 包 1 通过 pip 安装
计算机 1 运行标注工具
显示器 1 用于 GUI 操作

所需工具

工具用途是否必需
Python 环境 运行 labelme ✅ 是
终端/命令行 启动 labelme ✅ 是
文本编辑器 编辑标签列表文件 ▢ 推荐

能力画像

记忆与知识检索
1/5
逻辑推演
1/5
表达与交流
1/5
感知与观察
1/5
数理与计算
1/5
动手与操作
3/5
狂热与坚持
1/5
创造与创新
1/5

所需技能

🔧 **动手能力**:能够安装 Python 环境、使用命令行启动工具、配置标签列表文件。 💻 **编程能力**:无需编程基础即可使用 GUI 标注;若需自定义配置或集成 AI 模型,需具备 Python 基础。 ⚡ **电子电路**:不涉及。

适用场景

计算机视觉研究中的图像/视频数据集标注
语义分割、实例分割、目标检测、图像分类等任务的训练数据准备
需要 AI 辅助快速生成多边形/掩码标注的场景
多语言团队协作的图像标注项目