智能R2-D2助手 Smart-R2-D2-Assistant

ESP32 ⭐⭐⭐☆☆ (3/5) 🧩 软硬件结合 已发布
CinarSamet 5 Stars 未知 BOM 完整度: /5 教程完整度: /5

项目简介

开源AI驱动的R2-D2复制品,含3D打印部件、ESP32实时语音交互、Whisper STT。


开源AI驱动的R2-D2复制品,采用3D打印部件,通过ESP32实现实时语音交互,集成Whisper语音识别、Gemini大语言模型和Edge-TTS语音合成。

项目特点

**实时边缘到云通信**:ESP32通过I2S协议采集麦克风的RAW PCM音频数据,并通过HTTP实时传输到本地服务器。
**高精度语音转文字**:使用OpenAI Whisper (Turbo) 模型进行高精度语音识别。
**上下文感知AI对话**:集成Google Gemini API,生成符合R2-D2角色设定的上下文感知对话回复。
**自然语音合成**:利用Edge-TTS基础设施进行流畅自然的语音合成。
**动态OLED面部表情**:使用`RobotFace`库在OLED显示屏上显示基于状态(聆听、思考、说话等)的动态面部动画。
**无线管理与OTA更新**:支持通过WiFiManager进行网络配置,并通过ArduinoOTA进行远程无线代码更新。

技术规格

主控制器
麦克风
音频输出
显示屏
唤醒传感器
电源
语音识别
大语言模型
语音合成
服务器框架
通信协议

项目资源

物料清单 (BOM)

物料名称 数量 参考价格 备注
ESP32 开发板 (如 DevKit V1) 1 项目核心,负责WiFi、I2S音频和OLED动画
INMP441 I2S MEMS麦克风 1 用于清晰拾音
MAX98357A I2S D类功放模块 1 将数字音频转换为声音
3W扬声器 1 播放语音回复和系统音效
SSD1306 I2C OLED显示屏 1 显示实时面部表情和系统状态
TTP223 电容式触摸传感器 1 作为唤醒触发,开始监听
18650锂电池 1 高容量可充电锂离子电池,提供主要电源
TP4056 锂电池充电模块 1 带保护电路的锂电池充电器
MT3608 升压转换器 1 将电池电压升压至稳定的5V
3D打印外壳和底盘 1套 从零设计,完全优化用于3D打印

所需工具

工具用途是否必需
3D打印机 打印外壳和内部结构件 ✅ 是
焊台 焊接电子元件和连接线 ✅ 是
螺丝刀套件 组装和固定硬件 ✅ 是
热熔胶枪 固定线和元件 ▢ 推荐
万用表 测试电路连接和电压 ▢ 推荐
计算机 运行Flask服务器和Arduino IDE ✅ 是

能力画像

记忆与知识检索
1/5
逻辑推演
3/5
表达与交流
1/5
感知与观察
2/5
数理与计算
3/5
动手与操作
4/5
狂热与坚持
3/5
创造与创新
4/5

所需技能

🔧 **动手能力**:需要具备3D打印、电子元件焊接、电路连接和机器人组装的能力。 💻 **编程能力**:需要熟悉Arduino IDE (C++) 和 Python (Flask),能够配置WiFi、API密钥和修改代码。 ⚡ **电子电路**:需要理解I2S、I2C等通信协议,以及电源管理(锂电池、升压模块)的基本知识。

适用场景

**个人机器人项目**:作为学习机器人技术、AI集成和3D打印的综合性实践项目。
**桌面AI助手**:作为一个具有角色扮演功能的、可交互的桌面语音助手。
**创客展示与教育**:在创客空间、科技展览或教育环境中展示边缘计算与AI的结合。
**《星球大战》粉丝项目**:为粉丝提供一个高度还原且功能丰富的R2-D2复制品。