国际财经

出高招跳脱英伟达限制 DeepSeek恐改用中国产芯片

(北京9日讯)中国AI新创公司DeepSeek(深度求索)开发的AI大模型,绕过了美国巨头英伟达的CUDA(统一运算架构),这为未来DeepSeek与中国国产GPU芯片的相容性做好准备。

据中时新闻网引述快科技、Tom's Hardware报道,英伟达开发的CUDA能大幅降低研发大模型的难度,并获得全球开发商的广泛应用,让英伟达在AI芯片领域稳居龙头地位。然而,最新发现指出,DeepSeek在使用英伟达H800芯片进行训练时,采用的是英伟达底层硬体指令PTX(Parallel Thread Execution)语言,而非高阶编程语言CUDA。

PTX编程语言极其复杂且难以维护,因此业界通常偏向于使用CUDA等高级编程语言。

北京航空航天大学副教授黄雷表示,DeepSeek绕过CUDA意味着其能够根据GPU驱动函数直接开发创新,以实现更精细的操作。

简而言之,DeepSeek将优化提升至极致境界。

DeepSeek拥有擅长撰写PTX语言的内部开发人员,如果未来改用中国国产GPU,DeepSeek将能更得心应手地处理硬体相容性问题。他们只要了解硬体驱动提供的基本函数介面,即可仿效英伟达GPU硬体编程介面编写相关程式,让自家的AI模型更容易与中国本土硬体兼容。

新闻来源:中时新闻网

反应

 

国际财经

DeepMind执行长评Deepseek:中国最佳作品 但炒作太过

(巴黎10日讯)谷歌(Google)旗下DeepMind的执行长哈萨比斯(Demis Hassabis)周日(9日)评论,Deepseek的AI模型“可能是中国最好作品”,但并未呈现出任何新的科学进展。

Deepseek上月横空出世,引发科技股大幅抛售潮,以及大型科技公司是否在AI基础设施上花费太高的广泛讨论。

在巴黎举办人工智能行动峰会前夕,哈萨比斯于一场Google主办的活动上称赞Deepseek的模型是“令人印象深刻的作品”:“我认为这可能是我见过中国最好的作品。”

他说,Deepseek可以做“极佳的工程”,而且它“在地缘政治的层面上改变了事态”。

然而,从技术的角度来看,哈萨比斯表指出并非很大的改变。“尽管有炒作,但实际上并没有任何新的科学进步......它使用的是(AI)已知技术”,围绕Deepseek的炒作被“夸大了一点”。

哈萨比斯称Google上周公布的Gemini 2.0 Flash模型,比DeepMind的模型更有效率。

至于比人类更聪明的通用人工智能(AGI)何时才能出现,哈萨比斯表示,AI产业正在迈向AGI的道路上:“我认为现在已经很接近了,也许离那样的系统只差5年左右,那将会是非常了不起的事。”

新闻来源:世界新闻网

反应
 
 

相关新闻

南洋地产