语音会话

状态：运行中 (Running)。桌面端聊天语音会话、语音执行器和语音工作流合约已在内核层面 (agent-chat-voice-*-contract.md) 发布。

桌面语音会话是用户与 Agent 进行语音对话的界面：用户输入语音，Agent 回复语音，字幕同步呈现，生命周期状态明确。合约按职责划分为会话、执行器和工作流三部分。

三个合约

这种划分把“用户是否开始了一次语音对话”、“一轮如何执行”以及“Agent 的语音身份如何在轮次间绑定”分开处理。

负责	不负责
桌面端聊天语音界面的生命周期 + UI	语音资产创建 (`K-VOICE-*` 运行时 — 请参阅语音资产生命周期)
聊天中的每轮语音执行器	TTS / STT 提供者语义（运行时）
聊天中的工作流 + 身份绑定	Avatar 唇形同步（Avatar）

桌面语音界面通过带字幕的聊天 UI 消费运行时语音能力。它不涉及语音克隆或资产存储。

用户在聊天中点击语音并说话。