简体中文
Appearance
轻量级、跨平台的多模态 AI 交互主控框架。支持实时语音、视觉识别和 IoT 设备控制,可部署于桌面及 ARM 嵌入式平台。
支持语音输入与识别,实现智能人机交互,提供自然流畅的对话体验。采用异步架构设计,支持实时音频处理和低延迟响应。
支持图像识别和处理,提供多模态交互能力,理解图像内容。集成OpenCV摄像头处理,支持实时视觉分析。
基于JSON-RPC 2.0协议的模块化工具系统,内置音乐播放、八字命理等丰富功能,可动态扩展工具插件。
采用Thing抽象模式设计,支持智能家居设备控制,包括灯光、音量、温度传感器等,集成Home Assistant智能家居平台,可轻松扩展。
基于Opus编解码的实时音频传输,支持智能重采样技术,5ms音频帧间隔处理,确保低延迟高质量的音频体验。
兼容Windows 10+、macOS 10.15+和Linux系统,支持GUI和CLI双模式运行,自适应不同平台的音频设备和系统接口。