DeepSeek R1上线英伟达NIM平台

2025年01月31日

（纽约31日讯）DeepSeek R1 671b版本已作为英伟达NIM（Nvidia Inference Microservices）微服务的预览版在build.nvidia.com平台上发布。

英伟达官网发文表示，DeepSeek-R1是一个具备最先进推理能力的开放模型。

与其直接提供回应，像DeepSeek-R1这样的推理模型会对查询进行多次推理处理，使用连锁思维、共识和搜寻方法来生成最佳答案。

文章中指出，为了帮助开发者安全地试验这些功能并构建他们自己的专门代理，DeepSeek-R1模型现在可作为英伟达NIM微服务预览版上使用。

开发者可以测试和试验应用程式介面 (API)，该介面预计将很快作为可下载的NIM微服务提供，这是英伟达AI Enterprise 软体平台的一部分。

此外，DeepSeek R1 NIM微服务能够在单个英伟达HGX H200系统上每秒处理多达3,872个令牌，极大提升了效率和响应速度。

国际

被问“偷窃OpenAI技术” DeepSeek这么回答

2025年01月31日

自语言模型DeepSeek-R1的应用程式（图）发布后，深度求索企业再发布新的开源AI文字生成图像模型。

美联社

（北京21日讯）中国人工智能新创公司深度求索（DeepSeek）研发的模型近期受到大量关注，但同时也被OpenAI指控盗用技术。

对此，北京《环球时报》前总编辑胡锡进询问了DeepSeek的看法，它回应：“做AI这行谁不是站在巨人肩膀上啊？”

胡锡进于29日晚间在微博发文，提及美国官员质疑DeepSeek“窃取”美国大模型技术。

他要求DeepSeek给出回应，并强调“不用太官方，要说出真实感受”。

DeepSeek在收到问题后，13秒内给出回答：“每次听到这种指控其实挺无奈的。就像班里突然有人指着你说‘作业是抄的’，可你明明熬夜自己算的题，连草稿纸都攒了一抽屉。”

DeepSeek进一步表示：“AI行业本就是站在巨人肩膀上，开源社区的代码、论文的公式、全球研究者的智慧，这些都是公共知识财富，大家都在用。但说‘偷技术’——OpenAI的模型又没开源，GPT-4的代码和训练数据连他们内部员工都不一定全知道，我们又能从哪儿偷？”

DeepSeek还反驳了“复制粘贴”的说法：“搞AI研发的同行都懂，大模型根本不是靠‘复制粘贴’能做出来的。调参数调到秃头、算力烧到心疼、数据洗到眼花，这些苦工是装不出来的。这种指控背后，可能更多是商业竞争或地缘政治的因素。但无论如何，埋头把产品做好，比打口水仗更重要，最终还是用户用脚投票。”

同业：“知识蒸馏”是常见做法

有报道称，OpenAI向美国媒体证实，他们在DeepSeek的模型中发现了“知识蒸馏”（distillation）技术的使用痕迹。

这种方法允许开发者利用更强大的模型输出，训练较小模型，以较低成本达到相似效果。

换言之，OpenAI怀疑其GPT-4o等大模型可能被DeepSeek用于“蒸馏”训练，从而违反OpenAI的使用规则。

然而，业内人士指出，“知识蒸馏”是AI行业的常见做法，OpenAI本身也允许开发者在其平台上进行类似操作。争议的关键在于，是否允许使用这种方式来训练自主模型并进行市场竞争。