国际财经

DeepSeek R1上线英伟达NIM平台

(纽约31日讯)DeepSeek R1 671b版本已作为英伟达NIM(Nvidia Inference Microservices)微服务的预览版在build.nvidia.com平台上发布。

英伟达官网发文表示,DeepSeek-R1是一个具备最先进推理能力的开放模型。

与其直接提供回应,像DeepSeek-R1这样的推理模型会对查询进行多次推理处理,使用连锁思维、共识和搜寻方法来生成最佳答案。

文章中指出,为了帮助开发者安全地试验这些功能并构建他们自己的专门代理,DeepSeek-R1模型现在可作为英伟达NIM微服务预览版上使用。

开发者可以测试和试验应用程式介面 (API),该介面预计将很快作为可下载的NIM微服务提供,这是英伟达AI Enterprise 软体平台的一部分。

此外,DeepSeek R1 NIM微服务能够在单个英伟达HGX H200系统上每秒处理多达3,872个令牌,极大提升了效率和响应速度。

反应

 

国际

被问“偷窃OpenAI技术” DeepSeek这么回答

(北京21日讯)中国人工智能新创公司深度求索(DeepSeek)研发的模型近期受到大量关注,但同时也被OpenAI指控盗用技术。

对此,北京《环球时报》前总编辑胡锡进询问了DeepSeek的看法,它回应:“做AI这行谁不是站在巨人肩膀上啊?”

胡锡进于29日晚间在微博发文,提及美国官员质疑DeepSeek“窃取”美国大模型技术。

他要求DeepSeek给出回应,并强调“不用太官方,要说出真实感受”。

DeepSeek在收到问题后,13秒内给出回答:“每次听到这种指控其实挺无奈的。就像班里突然有人指着你说‘作业是抄的’,可你明明熬夜自己算的题,连草稿纸都攒了一抽屉。”

DeepSeek进一步表示:“AI行业本就是站在巨人肩膀上,开源社区的代码、论文的公式、全球研究者的智慧,这些都是公共知识财富,大家都在用。但说‘偷技术’——OpenAI的模型又没开源,GPT-4的代码和训练数据连他们内部员工都不一定全知道,我们又能从哪儿偷?”

DeepSeek还反驳了“复制粘贴”的说法:“搞AI研发的同行都懂,大模型根本不是靠‘复制粘贴’能做出来的。调参数调到秃头、算力烧到心疼、数据洗到眼花,这些苦工是装不出来的。这种指控背后,可能更多是商业竞争或地缘政治的因素。但无论如何,埋头把产品做好,比打口水仗更重要,最终还是用户用脚投票。”

同业:“知识蒸馏”是常见做法

有报道称,OpenAI向美国媒体证实,他们在DeepSeek的模型中发现了“知识蒸馏”(distillation)技术的使用痕迹。

这种方法允许开发者利用更强大的模型输出,训练较小模型,以较低成本达到相似效果。

换言之,OpenAI怀疑其GPT-4o等大模型可能被DeepSeek用于“蒸馏”训练,从而违反OpenAI的使用规则。

然而,业内人士指出,“知识蒸馏”是AI行业的常见做法,OpenAI本身也允许开发者在其平台上进行类似操作。争议的关键在于,是否允许使用这种方式来训练自主模型并进行市场竞争。

反应
 
 

相关新闻

南洋地产