labelme - iMakething

项目简介

Image annotation with Python. Supports polygon, rectangle, circle, line, point, and AI-assisted annotation.

Labelme 是一款基于 Python 开发的图形化图像标注工具，其设计灵感源自 MIT 的 LabelMe 项目。它使用 Qt 构建图形界面，旨在为计算机视觉任务提供高效、灵活且跨平台的标注解决方案。该工具解决了研究人员和开发者在进行图像分割、目标检测、分类等任务时，缺乏一个直观、易用且功能全面的标注平台的问题。通过 Labelme，用户可以轻松地为图像中的物体创建多边形、矩形、圆形、线条和点等多种形状的标注，并支持为图像添加分类标签和清理标记。其核心功能不仅限于静态图像，还扩展到了视频标注领域，能够处理时序数据。技术栈方面，Labelme 完全基于 Python 生态，利用 Qt 框架实现跨平台的图形界面，并支持通过 pip 进行快速安装，同时也提供了独立的可执行文件，方便不熟悉 Python 环境的用户使用。项目的一大亮点是其对 AI 辅助标注的支持，集成了 SAM、EfficientSAM 等模型，能够实现从点到多边形或遮罩的智能生成，以及通过 YOLO-world 和 SAM3 模型进行文本到标注的转换，极大提升了标注效率。此外，Labelme 支持超过 20 种语言的界面，包括中文、日文、韩文等，并允许用户自定义标签列表、自动保存和标签验证等 GUI 行为。它能够将标注结果导出为 VOC 格式（用于语义/实例分割）和 COCO 格式（用于实例分割），无缝对接主流深度学习框架的数据处理流程。无论是用于学术研究中的数据集构建，还是工业应用中的模型训练数据准备，Labelme 都是一个强大且广受欢迎的开源选择。

项目特点

支持多边形、矩形、圆形、线条、点等多种标注形状

支持图像分类和清洗的标记（flag）功能

支持视频标注

支持 GUI 自定义（预定义标签/标记、自动保存、标签验证等）

支持导出 VOC 格式数据集（语义分割、实例分割）

支持导出 COCO 格式数据集（实例分割）

集成 AI 辅助标注：SAM、EfficientSAM 实现点转多边形/掩码

集成 AI 文本转标注：YOLO-world、SAM3 模型

支持 20 种语言界面（英文、中文、日文、韩文等）

技术规格

编程语言	Python
图形界面框架	Qt
标注格式	JSON
导出格式	VOC、COCO
AI 模型支持	SAM、EfficientSAM、YOLO-world、SAM3
支持操作系统	Windows、macOS、Linux
安装方式	pip、独立可执行文件、Linux 发行版包管理器
许可证	未知（需查看仓库 LICENSE 文件）

项目资源

GitHub 仓库 labelme.io Discord 社区 PyPI 页面安装教程（终端）安装教程（应用）默认配置文件

搜索资源

百度必应搜狗 Google DuckDuckGo GitHub Gitee B站 YouTube 知乎小红书微信 CSDN Hackster Hackaday Printables Instructables OSHWHub

物料清单 (BOM)

物料名称	数量	参考价格	备注
Python	1	—	运行环境
Qt (PyQt5/PySide2)	1	—	图形界面依赖
labelme 包	1	—	通过 pip 安装
计算机	1	—	运行标注工具
显示器	1	—	用于 GUI 操作