Dictation

使用语音与 Cline 交流,实现更快、更自然的 AI 协作

语音输入改变了你与 AI 的协作方式。不是打字表达复杂想法,而是自然说话并分享你的完整意图。这不仅仅是速度的问题——虽然语音确实更快——而是关于实现打字无法匹配的流畅协作。

为什么语音改变一切

当你打字时,你在自我编辑。你简化复杂的想法,跳过上下文,失去细微差别。当你说话时,你分享脑海中的一切——完整的问题、约束条件、你担心的边缘情况。

计划模式arrow-up-right中持续使用语音输入进行快速来回讨论。不是打字仔细、结构化的提示,而是思考问题。Cline 会提出澄清性问题,立即回应,并迭代直到制定可靠的计划。

打字的摩擦阻碍了真正的协作。语音消除了这种摩擦。

开始使用

启用语音输入:

  1. 转到设置 → 功能 → 语音输入

  2. 切换"启用语音输入"开启

  3. 出现提示时登录到你的 Cline 账户

  4. 如果你还没有安装 FFmpeg(Cline 会指导你)

一旦启用,你会在聊天输入区域看到麦克风按钮。

使用语音输入:

  • 点击麦克风按钮开始录音

  • 自然说话

  • 再次点击停止录音

  • 等待转录出现在聊天中

语音输入适用于你配置的任何 AI 模型。转录通过 Cline 的服务进行,但你的对话继续使用你正在使用的任何模型。

系统要求

语音输入目前在 Windows 上不可用。计划在未来版本中支持 Windows。

语音输入使用 FFmpeg 在所有平台上捕获你的声音:

  • macOS:FFmpeg(通过 Homebrew:brew install ffmpeg

  • Linux:FFmpeg(通过 apt:sudo apt-get install ffmpeg

如果你没有安装 FFmpeg,Cline 会自动检测到这一点并提示你一键安装它。

语音输入的用武之地

计划模式对话

语音输入非常适合计划模式arrow-up-right讨论。不是仔细制作提示,你可以:

  • 一次性口述你的整个问题上下文

  • 立即回应 Cline 的问题

  • 在没有打字摩擦的情况下迭代想法

  • 当 Cline 倾听时大声思考

通过连续说 2-3 分钟开始规划会议,解释你正在构建的完整上下文、你正在处理的约束以及你面临的具体挑战。

复杂问题解释

有些问题很难打字表达。当你处理以下内容时:

  • 带有边缘情况的多步工作流

  • 跨多个系统的集成挑战

  • 带有特定重现步骤的性能问题

  • 需要详细上下文的 UI/UX 问题

说话让你自然地解释完整情况,包括所有重要的"哦,还有..."细节。

代码审查和调试

在审查代码或解释错误时,语音让你可以走过你的思维过程:

  • "这个函数看起来没问题,但我担心当……会发生什么"

  • "问题可能在这部分,或者可能在另一个区域……"

  • "我试过 X 和 Y,但都没有起作用,因为……"

你可以分享你的完整调试之旅,而不仅仅是最终问题。

技术要求

系统要求:

  • 系统上安装了 FFmpeg

  • 活动的互联网连接

  • 带有转录额度的 Cline 账户

音频质量:

  • 以 Opus 编解码器录制 WebM 格式

  • 16kHz 采样率的单声道音频

  • 针对语音识别进行了优化

隐私:

  • 音频在你的机器上本地录制

  • 仅发送音频文件进行转录

  • 转录后不存储音频

  • 临时文件自动清理

成本和额度

通过你的 Cline 账户进行语音转录的费用为每分钟 $0.006。对于大多数用户,这相当于每次会话几美分。

典型的 5 分钟规划对话费用约为 3 美分。即使是重度语音用户,每月也很少花费超过几美元。

定价是实验性的,可能会随着我们优化服务而变化。

最佳实践

自然说话 不要试图像打字一样说话。使用你正常的对话语气,不要担心完美的语法。

先提供上下文 从大局开始,然后深入细节。"我正在构建一个需要处理实时数据的 React 应用程序,我在 WebSocket 连接方面遇到性能问题……"

使用语音进行探索 语音输入非常适合探索性对话,你不确定确切需要什么。通过问题开始交谈,让对话自然发展。

与文本结合 你不必对所有内容都使用语音。使用语音进行复杂的解释和上下文,然后切换到文本进行快速后续追问或代码片段。

故障排除

麦克风不工作

  • 检查你的 IDE 的麦克风访问权限

  • 确保 FFmpeg 已正确安装

  • 尝试刷新 VSCode/你的编辑器

转录质量差

  • 清晰地以正常音量说话

  • 如果可能,减少背景噪音

  • 检查你的麦克风设置

连接问题

  • 验证互联网连接

  • 检查防火墙是否阻止 Cline 的服务器

  • 尝试退出并重新登录到你的 Cline 账户

身份验证问题

  • 如果你看到身份验证错误,请退出并重新登录到你的 Cline 账户

  • 检查你的账户是否有足够的转录额度

  • 验证你的互联网连接稳定

音频录制问题

  • 确保 FFmpeg 已正确安装且可访问

  • 检查你的浏览器/IDE 是否有麦克风权限

  • 如果音频捕获失败,尝试重启你的编辑器

AI 协作的未来

当你能够像思考一样快地说出你的想法时,你停止自我编辑。你分享完整的上下文、边缘情况、重要的"如果"场景。这导致更好的解决方案和更少的来回澄清。

Last updated