

Techub News 消息,Google 为其 Gemini 桌面应用推出语音听写功能「Speak to Window」,允许用户通过按住 Fn 键在任何打开的应用程序中直接输入语音指令,无需切换标签页即可处理邮件、编辑文档或对比产品。 该功能与 Magic Pointer 同时推出,后者结合屏幕指向与上下文语音或文本提示,利用 Gemini 的视觉-语言模型能力,用户可指向屏幕任意元素并提问,无需截图粘贴到聊天窗口。此举标志着 Google 将 Gemini 从聊天机器人转型为桌面级 AI 助手,与 OpenAI 和 Anthropic 的桌面应用策略形成竞争。(cryptobriefing.com)