# Dictation

语音输入改变了你与 AI 的协作方式。不是打字表达复杂想法，而是自然说话并分享你的完整意图。这不仅仅是速度的问题——虽然语音确实更快——而是关于实现打字无法匹配的流畅协作。

### 为什么语音改变一切

当你打字时，你在自我编辑。你简化复杂的想法，跳过上下文，失去细微差别。当你说话时，你分享脑海中的一切——完整的问题、约束条件、你担心的边缘情况。

在[计划模式](https://github.com/HybridTalentComputing/cline-chinese/blob/main/features/plan-and-act/README.md)中持续使用语音输入进行快速来回讨论。不是打字仔细、结构化的提示，而是思考问题。Cline 会提出澄清性问题，立即回应，并迭代直到制定可靠的计划。

打字的摩擦阻碍了真正的协作。语音消除了这种摩擦。

### 开始使用

**启用语音输入：**

1. 转到设置 → 功能 → 语音输入
2. 切换"启用语音输入"开启
3. 出现提示时登录到你的 Cline 账户
4. 如果你还没有安装 FFmpeg（Cline 会指导你）

一旦启用，你会在聊天输入区域看到麦克风按钮。

**使用语音输入：**

* 点击麦克风按钮开始录音
* 自然说话
* 再次点击停止录音
* 等待转录出现在聊天中

语音输入适用于你配置的任何 AI 模型。转录通过 Cline 的服务进行，但你的对话继续使用你正在使用的任何模型。

### 系统要求

语音输入目前在 Windows 上不可用。计划在未来版本中支持 Windows。

语音输入使用 FFmpeg 在所有平台上捕获你的声音：

* **macOS**：FFmpeg（通过 Homebrew：`brew install ffmpeg`）
* **Linux**：FFmpeg（通过 apt：`sudo apt-get install ffmpeg`）

如果你没有安装 FFmpeg，Cline 会自动检测到这一点并提示你一键安装它。

### 语音输入的用武之地

#### 计划模式对话

语音输入非常适合[计划模式](https://github.com/HybridTalentComputing/cline-chinese/blob/main/features/plan-and-act/README.md)讨论。不是仔细制作提示，你可以：

* 一次性口述你的整个问题上下文
* 立即回应 Cline 的问题
* 在没有打字摩擦的情况下迭代想法
* 当 Cline 倾听时大声思考

通过连续说 2-3 分钟开始规划会议，解释你正在构建的完整上下文、你正在处理的约束以及你面临的具体挑战。

#### 复杂问题解释

有些问题很难打字表达。当你处理以下内容时：

* 带有边缘情况的多步工作流
* 跨多个系统的集成挑战
* 带有特定重现步骤的性能问题
* 需要详细上下文的 UI/UX 问题

说话让你自然地解释完整情况，包括所有重要的"哦，还有..."细节。

#### 代码审查和调试

在审查代码或解释错误时，语音让你可以走过你的思维过程：

* "这个函数看起来没问题，但我担心当……会发生什么"
* "问题可能在这部分，或者可能在另一个区域……"
* "我试过 X 和 Y，但都没有起作用，因为……"

你可以分享你的完整调试之旅，而不仅仅是最终问题。

### 技术要求

**系统要求：**

* 系统上安装了 FFmpeg
* 活动的互联网连接
* 带有转录额度的 Cline 账户

**音频质量：**

* 以 Opus 编解码器录制 WebM 格式
* 16kHz 采样率的单声道音频
* 针对语音识别进行了优化

**隐私：**

* 音频在你的机器上本地录制
* 仅发送音频文件进行转录
* 转录后不存储音频
* 临时文件自动清理

### 成本和额度

通过你的 Cline 账户进行语音转录的费用为每分钟 $0.006。对于大多数用户，这相当于每次会话几美分。

典型的 5 分钟规划对话费用约为 3 美分。即使是重度语音用户，每月也很少花费超过几美元。

定价是实验性的，可能会随着我们优化服务而变化。

### 最佳实践

**自然说话** 不要试图像打字一样说话。使用你正常的对话语气，不要担心完美的语法。

**先提供上下文** 从大局开始，然后深入细节。"我正在构建一个需要处理实时数据的 React 应用程序，我在 WebSocket 连接方面遇到性能问题……"

**使用语音进行探索** 语音输入非常适合探索性对话，你不确定确切需要什么。通过问题开始交谈，让对话自然发展。

**与文本结合** 你不必对所有内容都使用语音。使用语音进行复杂的解释和上下文，然后切换到文本进行快速后续追问或代码片段。

### 故障排除

**麦克风不工作**

* 检查你的 IDE 的麦克风访问权限
* 确保 FFmpeg 已正确安装
* 尝试刷新 VSCode/你的编辑器

**转录质量差**

* 清晰地以正常音量说话
* 如果可能，减少背景噪音
* 检查你的麦克风设置

**连接问题**

* 验证互联网连接
* 检查防火墙是否阻止 Cline 的服务器
* 尝试退出并重新登录到你的 Cline 账户

**身份验证问题**

* 如果你看到身份验证错误，请退出并重新登录到你的 Cline 账户
* 检查你的账户是否有足够的转录额度
* 验证你的互联网连接稳定

**音频录制问题**

* 确保 FFmpeg 已正确安装且可访问
* 检查你的浏览器/IDE 是否有麦克风权限
* 如果音频捕获失败，尝试重启你的编辑器

### AI 协作的未来

当你能够像思考一样快地说出你的想法时，你停止自我编辑。你分享完整的上下文、边缘情况、重要的"如果"场景。这导致更好的解决方案和更少的来回澄清。
