KALO ESP32 语音聊天AI伙伴 KALO-ESP32-Voice-Chat-AI-Friends

ESP32 ⭐⭐☆☆☆ (2/5) 已发布
kaloprojects 66 Stars 未知 BOM 完整度: /5 教程完整度: /5

项目简介

ESP32-based voice device for chatting with multiple custom AI bots. Recording questions with I2S microphone, transcribin


KALO-ESP32-Voice-Chat-AI-Friends 是一个基于 ESP32 芯片的语音对话设备开源项目,旨在让用户通过语音与多个自定义 AI 角色(称为“FRIENDS”)进行自然、连续的对话。该项目是早期 KALO-ESP32-Voice-ChatGPT 的全面升级版,核心创新在于支持创建多个拥有独立人格、系统提示词和专属语音的聊天机器人,用户只需喊出其名字即可激活对应的 AI 角色。

标签

项目特点

**多自定义AI伙伴**:支持创建1-N个自定义聊天机器人/伙伴,每个伙伴有独立的个性(系统提示)和语音参数
**语音交互**:通过I2S麦克风录音,按下按钮或触摸引脚进行录音,无长度限制,动态时长
**快速响应**:支持GroqCloud API服务,LLM AI响应速度提升约2倍
**多语言支持**:默认支持99种语言的语音转文字(STT)和57种语言的文字转语音(TTS)
**实时网络搜索**:通过关键词(如“GOOGLE”)触发实时网络搜索,并融入对话历史
**聊天历史邮件发送**:支持将完整聊天历史通过电子邮件发送到用户邮箱
**PSRAM支持**:支持PSRAM作为音频录制和转录的存储介质,无需SD卡
**硬件DIY模板**:提供PCB源文件和Gerber文件,方便用户自制硬件
**RGB状态指示**:不同颜色LED指示设备状态(就绪、录音、STT处理、LLM对话、TTS播放等)

技术规格

主控芯片
麦克风
音频输出
存储
状态指示
音量控制
网络连接
STT服务
LLM服务
TTS服务
编程语言
核心库
音频库

项目资源

物料清单 (BOM)

物料名称 数量 参考价格 备注
ESP32-WROVER 或 ESP32-S3(带PSRAM) 1 推荐带PSRAM版本
ESP32-WROOM-32(无PSRAM) 1 备选,需SD卡模块
INMP441 I2S数字麦克风 1 或兼容型号
MAX98357A I2S音频放大器 1 或兼容型号
3W/4Ω 扬声器 1 或兼容规格
RGB LED(WS2812B等) 1 可选
10KΩ 电位器 1 推荐
SD卡模块 + MicroSD卡 1 无PSRAM时必需
5V/2A USB电源 1 或电池供电模块
杜邦线/排线 若干 用于连接各模块
自定义PCB 1 可选,使用提供的Gerber文件制作

所需工具

工具用途是否必需
3D打印机 打印外壳和结构件 ▢ 推荐
焊台 焊接电子元件到PCB ✅ 是
万用表 测试电路连接 ✅ 是
螺丝刀 组装外壳 ▢ 推荐
剥线钳 处理连接线 ✅ 是
热风枪 焊接贴片元件 ▢ 推荐
USB数据线 连接ESP32到电脑 ✅ 是
电脑 编程和调试 ✅ 是

能力画像

记忆与知识检索
3/5
逻辑推演
2/5
表达与交流
3/5
感知与观察
2/5
数理与计算
2/5
动手与操作
4/5
狂热与坚持
3/5
创造与创新
3/5

所需技能

🔧 **动手能力**:需要焊接电子元件、连接I2S设备、组装外壳等硬件制作技能。推荐具备PCB制作和调试经验。 💻 **编程能力**:需要C++编程基础,熟悉Arduino IDE环境,能够配置API密钥和修改代码参数。了解ESP32开发流程。 ⚡ **电子电路**:需要理解I2S通信协议、数字麦克风和音频放大器的工作原理,能够阅读电路图和PCB设计文件。

适用场景

**智能家居语音助手**:作为家庭中的AI语音助手,提供信息查询、日程管理等功能
**个性化AI伙伴**:创建具有特定个性的AI伙伴,用于陪伴、娱乐或教育
**多语言翻译设备**:利用多语言支持功能,作为实时语音翻译工具
**语音控制原型**:作为物联网语音控制系统的开发原型
**AI对话研究**:用于研究AI对话系统、语音交互和多模态AI应用
**教育工具**:用于学习ESP32开发、AI API集成和语音处理技术