Appearance
py-xiaozhi 是一个使用 Python 实现的小智语音客户端,旨在通过代码学习和在没有硬件条件下体验 AI 小智的语音功能。
支持语音输入与识别,实现智能人机交互,提供自然流畅的对话体验。
支持图像识别和处理,提供多模态交互能力,理解图像内容。
支持智能家居设备控制,实现更多物联网功能,打造智能家居生态。
基于pygame实现的高性能音乐播放器,支持歌词显示和本地缓存,支持播放/暂停/停止、进度控制、歌词显示和本地缓存,提供更稳定的音乐播放体验。
支持唤醒词激活交互,免去手动操作的烦恼(默认关闭需要手动开启)。
实现连续对话体验,提升用户交互流畅度。
提供直观易用的 GUI,支持小智表情与文本显示,增强视觉体验。
支持 CLI 运行,适用于嵌入式设备或无 GUI 环境。
兼容 Windows 10+、macOS 10.15+ 和 Linux 系统,随时随地使用。
支持音量调节,适应不同环境需求,统一声音控制接口。
有效管理多轮对话,保持交互的连续性。
支持 WSS 协议,保障音频数据的安全性,防止信息泄露。
首次使用时,程序自动复制验证码并打开浏览器,简化用户操作。
避免 MAC 地址冲突,提高连接稳定性。
拆分代码并封装为类,职责分明,便于二次开发。
修复多项问题,包括断线重连、跨平台兼容等。