ESP32 AI语音助手
Esp32-Ai-Voice-Assistant
ESP32
⭐⭐☆☆☆ (2/5)
已发布
项目简介
分享完全免费的AI语音助手项目,可轻松构建自己的AI助手。
这是一个完全免费的DIY人工智能语音助手项目,基于ESP32-S3开发板和HuggingFace平台构建。项目的核心价值在于让用户无需支付任何API费用或订阅服务,就能拥有一个功能完整的AI语音助手。硬件方面,它采用ESP32-S3作为主控,必须配备8MB PSRAM以支持语音录制和处理,搭配INMP441 I2S麦克风进行声音采集,通过MAX98357A音频放大器驱动扬声器播放回复,并利用ST7789 TFT显示屏提供交互界面。所有复杂的AI运算都在云端完成:用户按下按钮开始录音,松开后音频被发送到HuggingFace Space上部署的自定义服务器,该服务器集成了语音转文字、大语言模型和文字转语音三个模块,处理完成后将生成的语音回复传回ESP32并自动播放。技术栈涵盖Arduino框架下的ESP32固件开发、Docker容器化部署、以及HuggingFace的AI模型调用。这个项目特别适合希望在低成本条件下探索AI语音交互的创客、教育工作者和硬件爱好者,它解决了传统语音助手依赖商业云服务、成本高昂且不够灵活的问题。目前仅支持英文交互,但为后续多语言扩展预留了空间。无论是用于智能家居控制、语音问答还是教育演示,这个开源方案都提供了一个完全自主可控的起点。
标签
项目特点
**100%免费**:无需任何付费API、服务或订阅
**HuggingFace集成**:自定义服务器实现STT(语音转文字)+ LLM(大语言模型)+ TTS(文字转语音)全流程
**ESP32-S3硬件**:基于强大的ESP32-S3开发板,需8MB PSRAM
**一键交互**:按钮按下录音,松开即发送并播放回复
**显示反馈**:ST7789 TFT显示屏显示状态信息
技术规格
| 主控芯片 | |
|---|---|
| 显示屏 | |
| 麦克风 | |
| 音频功放 | |
| 扬声器 | |
| 触发方式 | |
| AI服务 | |
| 支持语言 | |
| 通信方式 |
项目资源
物料清单 (BOM)
| 物料名称 | 数量 | 参考价格 | 备注 |
|---|---|---|---|
| ESP32-S3开发板(16MB Flash,8MB PSRAM) | 1 | — | PSRAM必须 |
| ST7789 TFT显示屏 | 1 | — | 用于显示状态 |
| INMP441 I2S MEMS麦克风 | 1 | — | 需在GND和VCC间加电容 |
| MAX98357A I2S音频放大器 | 1 | — | |
| 0.5W 8Ω扬声器 | 1 | — | |
| 轻触按钮 | 1 | — | 用于触发录音 |
| 电容(用于麦克风滤波) | 1 | — | 规格见视频说明 |
| 杜邦线/跳线 | 若干 | — | 用于电路连接 |
所需工具
| 工具 | 用途 | 是否必需 |
|---|---|---|
| 焊台 | 焊接电容等元件 | ✅ 是 |
| 3D打印机 | 打印外壳(可选) | ▢ 推荐 |
| 电脑 | 编写和上传Arduino代码 | ✅ 是 |
| USB数据线 | 连接ESP32-S3到电脑 | ✅ 是 |
能力画像
记忆与知识检索
1/5
逻辑推演
2/5
表达与交流
1/5
感知与观察
1/5
数理与计算
2/5
动手与操作
4/5
狂热与坚持
3/5
创造与创新
3/5
所需技能
🔧 **动手能力**:需要焊接电容、连接电路、组装硬件,适合有一定电子制作经验的爱好者
💻 **编程能力**:需要配置Arduino IDE、安装库、修改WiFi和服务器URL等参数,了解基本编程概念
⚡ **电子电路**:需要理解I2S通信、电源滤波(麦克风加电容)、基本电路连接
适用场景
**智能家居语音控制**:作为本地语音助手控制智能设备
**AI对话学习**:学习如何将边缘设备与云端AI服务结合
**创客教育**:展示嵌入式系统与AI的集成应用
**个人助理**:实现免费的AI语音问答功能