国际财经

大企业整合DeepSeek开源模型 OpenAI CEO承认选错边

(华盛顿2日讯)中国新创DeepSeek以开源策略受到大批开发人员关注、对大型语言模型供应商造成冲击。

美国新创OpenAI总执行长奥特曼(Sam Altman)星期五(1月31日)在社群论坛Reddit线上问答活动表示,他认为OpenAI站在历史错误一边,需想出一个开源策略。

不过他也说,办公室内部在讨论这个议题,并非所有OpenAI的人员都同意这个观点,这也并非公司目前的首要任务。

中国公司深度求索(DeepSeek)近期推出开源推理模型,随后微软、亚马逊、英伟达(Nvidia)等公司迅速将其模型整合至云端与企业开发平台,对专注封闭模型的OpenAI造成冲击。

OpenAI最初成立曾承诺开源让人工智能(AI)技术造福人类,后因竞争和安全等考量,转向封闭模式。DeepSeek以开源模式崛起,OpenAI未来发展也受到外界关注。

开源策略犹如将武功秘笈公开在网络上,任何人皆可取用,根据自身需求对模型进行训练应用。

AI界领袖吴恩达日前在教育科技公司DeepLearning.AI对外刊物中表示,开源、开放权重模型已成为AI供应链关键,许多企业会采用这类模型,如果美国持续抑制开源发展,中国将逐步主导这一供应链环节,导致许多企业使用更体现中国价值观的模型。

 
 

 

反应

 

国际

DeepSeek与清华大学合作 盼降低AI模型训练成本

(北京7日讯)据彭博报道,DeepSeek正与清华大学合作,致力于减少AI模型所需的训练量,以降低营运成本。

同时,DeepSeek将新模型命名为DeepSeek-GRM,并计划以开源方式发布。

报道指出,DeepSeek与清华的研究人员合作发表论文,详述了一种新颖的强化学习方法,旨在提高模型效率。据研究人员介绍,这种新方法通过奖励更准确和易于理解的回应,帮助AI模型更好地符合人类偏好。

这种强化学习在特定应用领域,已被证明能加速AI任务,但将其扩展到更广泛的应用仍然具有挑战性,DeepSeek团队正尝试通过称为“self-principled critique tuning”的方法解决该问题。

根据论文,该方法在各项基准测试中都优于现有方法和模型,并且能以更少的计算资源实现更好的性能。

另一方面,其他AI开发商包括阿里巴巴(9988)和OpenAI亦在推进新领域,以改善AI模型在实时执行任务时的推理和自我完善能力。

反应
 
 

相关新闻

南洋地产
BESbswyBESbswyBESbswyBESbswyBESbswyBESbswy