微软加速打造自研尖端 AI 模型，目标明年具备最先进图文、音频处理能力

来源：IT家人工智能 | 2026-04-03 09:00:07

IT之家 4 月 3 日消息，据彭博社报道，微软正加速推进自研模型，目标是在未来几年内打造可与 OpenAI 和 Anthropic 竞争的前沿 AI 系统。微软 AI 负责人穆斯塔法 · 苏莱曼表示：“我们必须打造最前沿的模型。到 2027 年，目标是在文本、图像和音频能力上达到行业最先进水平。”作为阶段性成果，当地时间 4 月 2 日，微软发布了一款语音转录模型。在 25 种主流语言中，该模型在其中 11 种语言的测试中表现优于竞品。不过，该模型仍属于专用工具，强调效率与轻量化，与 Claude 3 Opus 或 GPT-4 这类通用大模型存在明显差异。在基础设施方面，微软正在加大投入。苏莱曼表示，公司已开始部署英伟达 GB200 芯片集群，并计划在未来 12 至 18 个月内将算力提升至前沿规模。过去，微软在开发通用大模型方面受到与 OpenAI 合作协议的限制，不过在去年协议调整之后，微软获得“松绑”，为推进自研模型扫清障碍。与此同时，微软内部也进行了调整。苏莱曼目前专注于模型研发，而 Copilot 业务则由前 Snap 高管雅各布 · 安德鲁负责。据IT之家了解，微软首席执行官萨提亚 · 纳德拉在本周的内部会议中强调，未来三到五年内实现 AI 能力自主化是核心目标。同时，微软仍将继续支持外部模型生态。苏莱曼表示，新发布的语音转录模型具备在复杂环境中过滤背景噪音的能力，未来将逐步应用于 Teams 等产品。广告声明：文内含有的对外跳转链接（包括不限于超链接、二维码、口令等形式），用于传递更多信息，节省甄选时间，结果仅供参考，IT之家所有文章均包含本声明。