Image annotation with Python. Supports polygon, rectangle, circle, line, point, and AI-assisted annotation.
Labelme 是一款基于 Python 开发的图形化图像标注工具,其设计灵感源自 MIT 的 LabelMe 项目。它使用 Qt 构建图形界面,旨在为计算机视觉任务提供高效、灵活且跨平台的标注解决方案。该工具解决了研究人员和开发者在进行图像分割、目标检测、分类等任务时,缺乏一个直观、易用且功能全面的标注平台的问题。通过 Labelme,用户可以轻松地为图像中的物体创建多边形、矩形、圆形、线条和点等多种形状的标注,并支持为图像添加分类标签和清理标记。其核心功能不仅限于静态图像,还扩展到了视频标注领域,能够处理时序数据。技术栈方面,Labelme 完全基于 Python 生态,利用 Qt 框架实现跨平台的图形界面,并支持通过 pip 进行快速安装,同时也提供了独立的可执行文件,方便不熟悉 Python 环境的用户使用。项目的一大亮点是其对 AI 辅助标注的支持,集成了 SAM、EfficientSAM 等模型,能够实现从点到多边形或遮罩的智能生成,以及通过 YOLO-world 和 SAM3 模型进行文本到标注的转换,极大提升了标注效率。此外,Labelme 支持超过 20 种语言的界面,包括中文、日文、韩文等,并允许用户自定义标签列表、自动保存和标签验证等 GUI 行为。它能够将标注结果导出为 VOC 格式(用于语义/实例分割)和 COCO 格式(用于实例分割),无缝对接主流深度学习框架的数据处理流程。无论是用于学术研究中的数据集构建,还是工业应用中的模型训练数据准备,Labelme 都是一个强大且广受欢迎的开源选择。