Omni 实时多模态对话

基于 Qwen-Omni 模型,支持音频+视频实时双向交互,VAD 自动检测语音

实时对话disconnected