DeepSeek 征服了移动世界,现在正在向 Windows 扩展——令人惊讶的是,它得到了微软的全力支持。昨天,这家软件巨头将 DeepSeek R1 模型添加到其 Azure AI Foundry,以允许开发人员使用它测试和构建基于云的应用程序和服务。今天,微软宣布将 R1 的精简版本引入 Copilot+ PC。 精简后的模型将首先应用于搭载骁龙 X 芯片的设备、搭载英特尔酷睿 Ultra 200V 处理器的设备,然后应用于基于 AMD Ryzen AI 9 的 PC。 第一个模型将是 DeepSeek-R1-Distill-Qwen-1.5B(即 15 亿参数模型),更大、更强大的 7B 和 14B 模型即将推出。这些模型将可从 Microsoft 的 AI Toolkit 下载。 微软必须调整这些模型,以优化它们,使其能够在配备 NPU 的设备上运行。严重依赖内存访问的操作在 CPU 上运行,而计算密集型操作(如变压器块)则在 NPU 上运行。通过优化,微软成功实现了快速的第一个令牌时间(130 毫秒)和短提示(少于 64 个令牌)每秒 16 个令牌的吞吐率。请注意,“令牌”类似于元音(重要的是,一个令牌通常不止一个字符长)。 微软是 OpenAI(ChatGPT 和 GPT-4o 的制造者)的坚定支持者和大量投资,但它似乎并不偏袒任何一方——它的 Azure Playground 有 GPT 模型(OpenAI)、Llama(Meta)、Mistral(一家 AI 公司),现在也有 DeepSeek。 Azure AI Foundry 游乐场中的 DeepSeek R1无论如何,如果您更喜欢本地 AI,请先下载适用于 VS Code 的 AI 工具包。从那里,您应该能够在本地下载模型(例如,“deepseek_r1_1_5”是 1.5B 模型)。最后,点击 Playground 中的“尝试”,看看这个精简版 R1 有多智能。 “模型蒸馏”有时也被称为“知识蒸馏”,是将大型 AI 模型(完整的 DeepSeek R1 有 6710 亿个参数)尽可能多地将其知识转移到较小的模型(例如 15 亿个参数)的过程。这不是一个完美的过程,蒸馏后的模型不如完整模型那么强大——但其较小的尺寸使其可以直接在消费级硬件上运行(而不是花费数万美元的专用 AI 硬件)。 来源 |
>>: Caviar 宣布推出受比特币启发的 iPhone 16 Pro 系列,采用 24k 黄金打造
Realme Neo7 SE 预计将于本月上市,其芯片组预计将采用新的联发科平台。今天,公司副总裁...
如果您一直在关注全新的 Galaxy S25 Ultra,那么您可以在 2 月 7 日星期五之前享受...
vivo 去年 4 月发布了 T3x 5G,最近有传言称其继任者 T4x 5G 将于 3 月在印度推...
OnePlus 本周早些时候发布了 13R,这款手机已经收到了第一个软件更新。如果你买了这款手机,基...
据称,荣耀 400 系列将于今年年中上市,而荣耀 Magic V4 也将于此时正式发布。本月早些时候...
向新发布的全球 Redmi Note 14 4G 问好。它附带一个灰色外壳、一根 USB-A 转 U...
如果您一直在关注最近推出的 Redmi Note 14 4G 和 Redmi Note 14 5G,...
DeepSeek 是人工智能领域最新的热门,华为、荣耀、微软甚至一些汽车制造商都已在其产品和服务中使...
三星 Galaxy S24 FE 用户仍在等待 One UI 7 更新,但现在有一种方法可以让真正好...
上周开始在全球推出的 OnePlus 13 正在接收新的软件更新,其中对谷歌 Gemini Nano...
联想将推出一系列全新 Legion 品牌游戏设备,包括掌上游戏机、笔记本电脑、台式机、显示器以及平板...
我们最近发布了 vivo X200 评测,其中提到,奥地利的 X200 电池容量为 5,220 mA...
苹果最近对其价格更实惠的 iPhone 系列进行了彻底改造,彻底取消了 SE 名称,并推出了 iPh...
Galaxy S25 系列的预订于上周开始,目前仍在进行中 - 公开销售将于 2 月 7 日正式开始...