ESP32 AI语音助手 Esp32-Ai-Voice-Assistant

ESP32 ⭐⭐☆☆☆ (2/5) 已发布
derdacavga 54 Stars GPL-3.0 BOM 完整度: /5 教程完整度: /5

项目简介

分享完全免费的AI语音助手项目,可轻松构建自己的AI助手。


这是一个完全免费的DIY人工智能语音助手项目,基于ESP32-S3开发板和HuggingFace平台构建。项目的核心价值在于让用户无需支付任何API费用或订阅服务,就能拥有一个功能完整的AI语音助手。硬件方面,它采用ESP32-S3作为主控,必须配备8MB PSRAM以支持语音录制和处理,搭配INMP441 I2S麦克风进行声音采集,通过MAX98357A音频放大器驱动扬声器播放回复,并利用ST7789 TFT显示屏提供交互界面。所有复杂的AI运算都在云端完成:用户按下按钮开始录音,松开后音频被发送到HuggingFace Space上部署的自定义服务器,该服务器集成了语音转文字、大语言模型和文字转语音三个模块,处理完成后将生成的语音回复传回ESP32并自动播放。技术栈涵盖Arduino框架下的ESP32固件开发、Docker容器化部署、以及HuggingFace的AI模型调用。这个项目特别适合希望在低成本条件下探索AI语音交互的创客、教育工作者和硬件爱好者,它解决了传统语音助手依赖商业云服务、成本高昂且不够灵活的问题。目前仅支持英文交互,但为后续多语言扩展预留了空间。无论是用于智能家居控制、语音问答还是教育演示,这个开源方案都提供了一个完全自主可控的起点。

标签

项目特点

**100%免费**:无需任何付费API、服务或订阅
**HuggingFace集成**:自定义服务器实现STT(语音转文字)+ LLM(大语言模型)+ TTS(文字转语音)全流程
**ESP32-S3硬件**:基于强大的ESP32-S3开发板,需8MB PSRAM
**一键交互**:按钮按下录音,松开即发送并播放回复
**显示反馈**:ST7789 TFT显示屏显示状态信息

技术规格

主控芯片
显示屏
麦克风
音频功放
扬声器
触发方式
AI服务
支持语言
通信方式

项目资源

物料清单 (BOM)

物料名称 数量 参考价格 备注
ESP32-S3开发板(16MB Flash,8MB PSRAM) 1 PSRAM必须
ST7789 TFT显示屏 1 用于显示状态
INMP441 I2S MEMS麦克风 1 需在GND和VCC间加电容
MAX98357A I2S音频放大器 1
0.5W 8Ω扬声器 1
轻触按钮 1 用于触发录音
电容(用于麦克风滤波) 1 规格见视频说明
杜邦线/跳线 若干 用于电路连接

所需工具

工具用途是否必需
焊台 焊接电容等元件 ✅ 是
3D打印机 打印外壳(可选) ▢ 推荐
电脑 编写和上传Arduino代码 ✅ 是
USB数据线 连接ESP32-S3到电脑 ✅ 是

能力画像

记忆与知识检索
1/5
逻辑推演
2/5
表达与交流
1/5
感知与观察
1/5
数理与计算
2/5
动手与操作
4/5
狂热与坚持
3/5
创造与创新
3/5

所需技能

🔧 **动手能力**:需要焊接电容、连接电路、组装硬件,适合有一定电子制作经验的爱好者 💻 **编程能力**:需要配置Arduino IDE、安装库、修改WiFi和服务器URL等参数,了解基本编程概念 ⚡ **电子电路**:需要理解I2S通信、电源滤波(麦克风加电容)、基本电路连接

适用场景

**智能家居语音控制**:作为本地语音助手控制智能设备
**AI对话学习**:学习如何将边缘设备与云端AI服务结合
**创客教育**:展示嵌入式系统与AI的集成应用
**个人助理**:实现免费的AI语音问答功能