AI 时代,微软的节奏

2024-05-22 246

「AI 将如何重塑你的未来」,这是今年 Microsoft Build 大会的主题。

今天凌晨,微软 CEO 萨提亚·纳德拉在微软 Build 年度开发者大会上,告诉所有人:为什么是微软,才能拥有如此宏大的野心——重塑所有人的未来。


微软的 Copilot 宇宙已经如预期般展开|图片来源:微软

过去一年,背靠 OpenAI 大模型优先使用权的微软,用 Copilot 掀起了「副驾驶」风潮。人们使用软件,不再只是点击图形界面(GUI)图标找功能,而是通过与 AI 助手的对话,用自然语言开启交互。通过 Copilot,全球最大的软件厂商——微软把 AI 生产力带给使用 Microsoft 365、Teams、Github 等微软全家桶用户的面前;

同时,微软面向所有开发者推出了做 Copilot 的工具栈——Copilot Stack,包括从底层算力到上层 AI 应用工具,让开发者做出更多软件的 Copilot 及其他 AI 应用,从而带给用户;

21 日的 Build 前瞻会上,微软的嫡系硬件 Surface 成为 AI+PC 的排头兵,踢掉英特尔、全力拥抱高通,微软找到了 AI 时代「Wintel」组合的重要伙伴。

在这场为开发者举办的会上,纳德拉主要向开发者介绍了 Copilot+PC 和 Copilot stack 的一系列更新,包括 Azure 云服务器、模型定制工具、模型商店、数据工具、AI 应用定制工具等各个层面的进展。

必不可少地,OpenAI 首席执行官 Sam Altman 同样在大会现身,并呼吁开发者们把握住平台变革的机遇。

值得玩味的是,去年的 Build 大会上,Altman 的出现让纳德拉或多或少表现出「受宠若惊」的神态;而今年的 Build 大会上,和 Altman 握手的是微软的 CTO Kevin Scott——别误会,OpenAI 对微软依然很重要,GPT-4o 依然是最好的大模型产品,但对微软来说,它和他都已不是唯一。

对于正在将由 AI 引发的新一代计算变革,逐渐拉回到「微软叙事」上,纳德拉和微软已经掌握好了节奏。


1

从 Copilot 

到 Team Copilot

相比于一年前,微软对 Copilot 的解读有了很大变化。

微软副总裁 Charles Lamanna 在接受 The Verge 采访时解释道:「我们很快意识到,将 Copilot 限制为仅对话,极大地限制了 Copilot 目前的功能。」「如果你能让你的 Copilot 更加主动,并且能够在后台执行自动化任务,而不是让 Copilot 一直等着有人与它聊天,那会怎么样呢?」

「2023 年微软 Copilot 专注于搜索数据、总结内容并生成新内容,2024 年的 Copilot 将非常注重可定制。」

今天凌晨,微软正式推出「Team Copilot」,将 Copilot 从幕后的 AI 问答助手辅,扩展为团队新的重要成员。微软官方博客概括了这一定义的转变:「副驾驶正在从与你一起工作的副驾驶,演变为为你工作的副驾驶。」这些 Copilot 将由某些事件触发,并使用企业自己的数据。

微软的这一定义正是半年来 AI 圈火热的智能体(agent)概念,后者可以智能地自主执行。

微软展示了新版 Copilot 与人群展开合作,不再是过去的一对一体验。Team Copilot 智能副驾驶能够在会议中担任会议主持人,管理会议议程、跟踪会议时间并记录会议要点;也可以在聊天中作为协作者,提供重要信息、跟踪行动项目并解决未决问题。它还可以担任项目经理,帮助确保每个项目顺利推进,并及时通知团队进行输入。微软计划在今年晚些时候预览 Team Copilot。


图片Team Copilot 可以和人类用户一起在群中工作  |图片来源:微软

微软也允许企业和开发人员可以定制自己的 AI Copilot,像虚拟员工一样工作、自动执行任务,比如能执行诸如监控电子邮件收件箱、自动执行员工任务或录数据等任务。

相应地,微软推出了 Microsoft Copilot Studio 及其扩展工具,让开发者能够根据特定任务和功能,构建主动响应数据和事件的「智能副驾驶」,同时也允许客户通过将其连接到新的数据源和应用程序来增强 Microsoft Copilot 智能副驾驶,从而扩展其功能。

基于这类新功能的「智能副驾驶」可通过记忆和知识了解上下文、推理操作和输入,基于用户反馈进行学习,并在不知道如何处理时寻求帮助,从而独立管理复杂、长期运行的业务流程。微软方面称,现在从 IT 设备采购到销售和服务的客户接待,用户都可以让基于 Microsoft Copilot Studio 构建的智能副驾驶为其工作。

而在消费端,微软+高通的 AI+PC 组合,结合微软的本地小模型,正在向终端 AI 的路上狂奔。


2

微软正在让 AI 进入现实

「我们正在经历一次不同寻常的平台浪潮。」微软首席技术官兼 AI 执行副总裁 Kevin Scott 在 Build 开发者大会上如此称。

这个所谓的平台浪潮,或许将从微软的小模型、OpenAI 的大模型以及其他一系列 AI 模型开始,以 Azure 云计算作为管道,以微软的 AI PC 作为终端载体,延伸至所有 PC 厂商的 Windows 设备。

首先,微软 Azure AI 的一大产品是「模型即服务」。在 Build 开发者大会上,微软宣布,OpenAI 前几天发布的 GPT-4o 现可在 Azure AI Studio 中使用,也可作为 API 使用,这一多模态模型集成了文本、图像和音频处理。

同时,微软开发的 AI 小语言模型(SLMs)Phi-3 系列,也发布了一款新的多模态模型——Phi-3-vision,有 42 亿参数,能够输入图像和文本,并接收文本回复。例如,用户可以就图表提出问题,或就特定图像提出开放式问题。

Phi-3 家族的「小模型」主要为有限计算资源和低延迟场景的生成型 AI 应用程序提供支持,可以在 Azure AI 和 AI 模型开源社区 Hugging Face 上找到,用哪个取决于任务的复杂性和可用的计算资源,可以说是主打一个「性价比」。

这些模型可与微软的 PC 终端结合,微软希望开发者能够在 Windows 上构建新的 AI 应用程序,为 PC 设备提供差异化的 AI 体验。据称,微软现在有 40 多个 AI 模型在 Windows 11 上运行。微软高管在 Build 大会上自信地称,「Windows 是最开放的人工智能平台」。


Phi-3 小模型的参数大小与相对质量 |图片来源:微软

就在一天前,微软推出了专为 AI 设计的新型 Windows PC,即 Copilot+ PC,可实现 40+ TOPS(每秒万亿次操作)。

微软称其「彻底重新构思了 PC 的整体架构,从芯片到操作系统,从应用层到云端,将AI置于核心地位,标志着 Windows 平台数十年来最重大的变革。」

新的架构将 CPU、GPU 以及 NPU 集成,可以连接到 Azure 云中运行的大语言模型(LLM)与小语言模型(SLM)。

据微软称,其「AI 工作负载性能提高了 20 倍」,与 MacBook Air 15 英寸对比,「持续多线程性能高出多达 58%」「本地视频播放电池续航时间长 20%」。

在对 OpenAI 的利用上,按照微软的说法,每台 Copilot+ PC 都配有个人 AI 助手,键盘上将有新的 Copilot 键,在未来几周内,用户可以访问包括 GPT-4o 在内的最新模型,

微软新 PC 的 AI 功能还包括:可以用「Recall」功能找到并记住用户在 PC 上看到的内容和做过的事情,以一条可以滚动浏览的时间线和各种快照呈现;可以用「Cocreator」在设备上直接生成和优化 AI 图像;可以用「Live Captions」生成实时字幕。


微软 Copilot+ PC 的 Recall 功能 |微软

其中,「Recall」的快照范围极广,涵盖用户在应用程序中做过的事情、实时会议里的通信、访问过的网站等等。在隐私问题上,微软称,「Recall」里的快照属于用户,保留在本地电脑上,用户可以删除单个快照,调整和删除时间范围,也可以选择过滤、不保存特定应用程序和网站。

不过,据悉运行「Recall」所需的最小硬盘空间为 256 GB,并且必须有 50 GB 的可用空间。256 GB 设备上 Recall 的默认分配为 25 GB,可存储大约 3 个月的快照。

在 AI 生成图像方面,之前,微软推出过网页版的图像生成工具,但可能会限制用户可以创建的图像数量,也存在隐私问题,Windows PC 内置「Cocreator」,通过 NPU 和本地小语言模型,可以实时生成新图像,或能以电脑本地的形式缓解用户的隐私焦虑。

据介绍,微软还与 Adobe、 DaVinci Resolve、CapCut、LiquidText、djay Pro 等合作,用户此后可以在 PC 设备上运行这些程序的 AI 功能,比如在 PS 图像处理、CapCut 视频剪辑中自动删除背景。

微软的新 PC 有比先前更多的原生 ARM 64 体验,包括各种 Microsoft 365 应用程序,以及 Chrome 浏览器、Spotify、Zoom、WhatsApp、Adobe Photoshop、DaVinci Resolve 等现在都在 Arm 上本地运行。

除了微软自己的 Surface,微软与 OEM 厂商宏碁、华硕、戴尔、惠普、联想、三星等合作,Copilot+ PC 将为这些主要 PC 制造商提供具有 AI 功能的 Windows 11 设备,搭载高通处理器,预计 6 月 18 日起开始供货。

PC 将加速 AI 创新,而微软的态度是,「只有当云和设备协同工作时,最丰富的 AI 体验才会成为可能。」

另外,OpenAI 首席执行官 Sam Altman 也出席了微软的 Build 开发者大会,表示模型将会变得越来越聪明,速度和成本都很重要,但最最重要的是「整体智能(overall intelligence)」。


OpenAI 的 Sam Altman(左)出席对谈微软 CTO |微软

Sam Altman 对开发者的建议是,「现在可能是自移动互联网诞生以来最激动人心的时机,不管是做一个产品,还是创建一家初创公司,做点新东西的最大机遇往往孕育于平台范式变革的时刻。」

「我们已经很长时间没见到平台范式变革了,现在看起来平台范式变革真的到来了。」

「所以,我最大的一个建议是,这是很特别的时机,把握住它吧。」Sam Altman 说道。

此外,他还提醒,「AI 并不意味着可以轻轻松松就创造一个伟大的产品,或者一家伟大的公司,或者伟大的服务,你还是得干活,AI 是一种加持,但单单 AI 是不会自动打破一些商业规则的,你可以利用这个新东西,但你还是得找到你做的东西的价值,这是在狂热的 AI 淘金热中很容易被忽视的。」