ESP-HA语音识别
esp-ha-speech
ESP32
⭐⭐☆☆☆ (2/5)
已发布
项目简介
ESP32本地语音识别用于Home Assistant。
这是一个基于ESP32芯片的本地语音识别开源项目,名为esp-ha-speech。它的核心功能是在ESP-BOX开发板上实现完全离线的唤醒词检测和语音指令识别,并将识别结果发送到Home Assistant智能家居平台。项目基于乐鑫官方的esp-box示例开发,目前默认唤醒词为“Hi, ESP”,用户可以通过MQTT协议动态添加和管理语音指令。技术栈方面,项目使用了ESP-IDF框架、ESP-SR语音识别库、MQTT通信协议,以及Home Assistant的文本对话集成或Rhasspy语音助手进行指令解析。该项目主要解决了在资源受限的微控制器上实现端到端语音控制的问题,无需依赖云服务,所有处理都在设备本地完成,既保护了用户隐私,又降低了网络延迟。适用场景包括智能家居的离线语音控制,比如在客厅或厨房部署多个ESP-BOX设备,通过配置不同的siteId实现分区控制。用户可以通过MQTT主题`esp-ha-speech/config/add_cmd`添加自定义语音指令,或使用项目提供的Python脚本从Home Assistant意图仓库自动生成指令。需要注意的是,该项目已被官方说明标记为概念验证性质,其功能已被esphome的语音助手实现所取代,但对于学习ESP32本地语音识别技术、研究离线智能家居控制方案仍有很好的参考价值。
标签
项目特点
完全在 ESP32 设备端运行,无需云端依赖
支持热词检测和语音识别
与 Home Assistant 深度集成
通过 MQTT 动态管理语音命令
支持多个 ESP32 设备(站点)分离管理
提供 Python 脚本简化命令配置
技术规格
| 硬件平台 | |
|---|---|
| 软件框架 | |
| 语音引擎 | |
| 通信协议 | |
| 集成平台 | |
| 可选组件 | |
| 热词 |
项目资源
物料清单 (BOM)
| 物料名称 | 数量 | 参考价格 | 备注 |
|---|---|---|---|
| ESP-BOX 开发板 | 1 | — | 核心硬件 |
| ESP-IDF 开发环境 | 1 | — | 编译和烧录 |
| MQTT Broker | 1 | — | 通信中间件 |
| Home Assistant | 1 | — | 智能家居平台 |
| Rhasspy | 1 | — | 可选,用于文本处理 |
所需工具
| 工具 | 用途 | 是否必需 |
|---|---|---|
| Visual Studio Code | 代码编辑和开发 | ▢ 推荐 |
| ESP-IDF 插件 | 编译和烧录固件 | ✅ 是 |
| esptool | 烧录固件 | ✅ 是 |
| Python 3 | 运行配置脚本 | ▢ 推荐 |
能力画像
记忆与知识检索
1/5
逻辑推演
3/5
表达与交流
1/5
感知与观察
2/5
数理与计算
2/5
动手与操作
3/5
狂热与坚持
2/5
创造与创新
3/5
所需技能
🔧 **动手能力**:需要能够连接和配置 ESP-BOX 硬件,设置 MQTT 和 Home Assistant 环境
💻 **编程能力**:需要熟悉 ESP-IDF 开发环境,了解 C/C++ 编程,能够配置和修改代码
⚡ **电子电路**:基本了解 ESP32 硬件和连接
适用场景
在 Home Assistant 智能家居系统中添加本地语音控制
需要离线语音识别的隐私敏感场景
多房间语音控制(通过 siteId 区分不同设备)
学习和研究 ESP32 语音识别技术