DeepSeek 征服了移动世界,现在正在向 Windows 扩展——令人惊讶的是,它得到了微软的全力支持。昨天,这家软件巨头将 DeepSeek R1 模型添加到其 Azure AI Foundry,以允许开发人员使用它测试和构建基于云的应用程序和服务。今天,微软宣布将 R1 的精简版本引入 Copilot+ PC。 精简后的模型将首先应用于搭载骁龙 X 芯片的设备、搭载英特尔酷睿 Ultra 200V 处理器的设备,然后应用于基于 AMD Ryzen AI 9 的 PC。 第一个模型将是 DeepSeek-R1-Distill-Qwen-1.5B(即 15 亿参数模型),更大、更强大的 7B 和 14B 模型即将推出。这些模型将可从 Microsoft 的 AI Toolkit 下载。 微软必须调整这些模型,以优化它们,使其能够在配备 NPU 的设备上运行。严重依赖内存访问的操作在 CPU 上运行,而计算密集型操作(如变压器块)则在 NPU 上运行。通过优化,微软成功实现了快速的第一个令牌时间(130 毫秒)和短提示(少于 64 个令牌)每秒 16 个令牌的吞吐率。请注意,“令牌”类似于元音(重要的是,一个令牌通常不止一个字符长)。 微软是 OpenAI(ChatGPT 和 GPT-4o 的制造者)的坚定支持者和大量投资,但它似乎并不偏袒任何一方——它的 Azure Playground 有 GPT 模型(OpenAI)、Llama(Meta)、Mistral(一家 AI 公司),现在也有 DeepSeek。 Azure AI Foundry 游乐场中的 DeepSeek R1无论如何,如果您更喜欢本地 AI,请先下载适用于 VS Code 的 AI 工具包。从那里,您应该能够在本地下载模型(例如,“deepseek_r1_1_5”是 1.5B 模型)。最后,点击 Playground 中的“尝试”,看看这个精简版 R1 有多智能。 “模型蒸馏”有时也被称为“知识蒸馏”,是将大型 AI 模型(完整的 DeepSeek R1 有 6710 亿个参数)尽可能多地将其知识转移到较小的模型(例如 15 亿个参数)的过程。这不是一个完美的过程,蒸馏后的模型不如完整模型那么强大——但其较小的尺寸使其可以直接在消费级硬件上运行(而不是花费数万美元的专用 AI 硬件)。 来源 |
>>: Caviar 宣布推出受比特币启发的 iPhone 16 Pro 系列,采用 24k 黄金打造
WhatsApp 正在开发一项与 Meta AI 有关的新功能。具体来说,这是一个适用于 Andro...
已经非常清楚,新款 iPhone SE 机型即将问世。按照现行的命名惯例,它几乎肯定会被称为 iPh...
昨天,有关即将推出的 Realme P3 Pro 的首批详细信息泄露,今天“原始”Realme P3...
早在 2023 年,Oppo 就从 OnePlus 那里借用了 Alert Slider,并在 Fi...
美国的 TikTok 用户可以庆祝他们心爱的应用程序重新上线了。周日,1.7 亿美国人得知了该应用程...
美国总统唐纳德·特朗普宣布,有四个不同的集团有意收购美国 TikTok 业务。他的政府没有透露这些集...
vivo X200 Ultra 将成为其 2025 年的全能相机旗舰,与小米 15 Ultra 和 ...
小米将于本月晚些时候在中国发布 15 Ultra,时间可能是 2 月 26 日。随后,这款手机还将在...
马克·古尔曼在彭博社最新一期的 Power On 新闻通讯中表示,苹果预计将为 Siri 注入自己的...
今天,谷歌宣布,美国版 AI Overviews 现已由 Gemini 2.0 提供支持。这将有助于...
昨天,即将推出的 Pixel 9a 官方谷歌保护壳被泄露,今天是时候展示这款手机的全部四种配色了,您...
本月初,vivo 正式发布了 V50,而 Google Play 控制台上的新列表显示,V50 Li...
据传,Oppo 正在研发 Find X8 Mini,它将与 Find X8 Ultra 一起推出,并...
三星一直在预告即将推出的 Galaxy M06 和 Galaxy M16 智能手机,现在我们终于可以...
今天早些时候,我们为您带来了即将推出的 iQOO Neo 10R 的官方图片,由该品牌自己分享。iQ...