Appearance
py-xiaozhi 是一个使用 Python 实现的小智语音客户端,旨在通过代码学习和在没有硬件条件下体验 AI 小智的语音功能。
支持语音输入与识别,实现智能人机交互,提供自然流畅的对话体验。采用异步架构设计,支持实时音频处理和低延迟响应。
支持图像识别和处理,提供多模态交互能力,理解图像内容。集成OpenCV摄像头处理,支持实时视觉分析。
基于JSON-RPC 2.0协议的模块化工具系统,支持日程管理、音乐播放、12306查询、地图服务、菜谱搜索、八字命理等丰富功能,可动态扩展工具插件。
采用Thing抽象模式设计,支持智能家居设备控制,包括灯光、音量、温度传感器等,集成Home Assistant智能家居平台,可轻松扩展。
基于Opus编解码的实时音频传输,支持智能重采样技术,5ms音频帧间隔处理,确保低延迟高质量的音频体验。
兼容Windows 10+、macOS 10.15+和Linux系统,支持GUI和CLI双模式运行,自适应不同平台的音频设备和系统接口。
感谢以下开发者对 py-xiaozhi 作出的贡献