国际财经

中国AI大模型引硅谷巨头震撼 Meta员工:内部出现恐慌

(华盛顿26日讯)中国AI大模型深度求索“DeepSeek”近日陆续推出“DeepSeek-V3”和“DeepSeek-R1”两款AI大模型,标榜成本低廉,性能可与OpenAI比肩,让硅谷一片震撼,甚至有Meta员工匿名发文称,内部出现恐慌心态,工程师开始连夜尝试复制DeepSeek的技术,探寻可能的成果。不过,该文章并未获得官方出面回应。

《每日经济新闻》报道,Scale AI创始人Alexander Wang在1月24日的采访中表示,DeepSeek在他们的测试里是表现最好的,与美国最好的模型相当。此前,Alexander Wang曾评价称,DeepSeek-V3是中国科技界带给美国的苦涩教训,“当美国休息时,中国(科技界)在工作,以更低的成本、更快的速度和更强的实力赶上。”

一名自称Meta员工24日在匿名平台teamblind上的贴文在网络上疯传。他提到,Meta内部因为DeepSeek的模型,已经进入恐慌模式,“工程师们正在疯狂地剖析DeepSeek,并从中复制任何我们能得到的东西。我一点也不夸张。”

据了解,深度求索在2024年12月27日推出开源模型DeepSeek-V3。当时,聊天机器人竞技场(Chatbot Arena)资讯显示,DeepSeek-V3在所有模型中排名第七,在开源模型排第一,也是全球前十中性价比最高的模型。

一个月内,深度求索在20日推出“DeepSeek-R1”推理模型,允许外界在在遵循MIT License的情况下,透过R1训练其他模型。

长期为硅谷输出人才的史丹佛大学和Epoch AI的研究人员在2024年中发表一项研究表明,到2027年,最大型的模型的训练成本将超过10亿美元。Gartner预测,Google、Microsoft和AWS等超大规模企业到2028年止,仅在AI服务器上的支出就将高达5000亿美元。

然而,“DeepSeek”的训练成本并不昂贵,Noah''s Arc资本管理公司表示,DeepSeek-V3模型有可能彻底改变训练和推理领域的游戏规则。知名财经记者Holger Zschaepitz 25日提到,DeepSeek以极低的价格建立了一个突破性的AI模型,而且没有使用尖端芯片,这让人们怀疑。该行业数千亿美元资本支出的效用。

新闻来源:ETtoday新闻云

反应

 

国际

印度中国达成协议 恢复中断近5年直航航线

(新德里27日讯)印度外交部星期一(1月27日)在声明中表示,印度一位高级特使访问北京期间,双方“原则上同意”恢复直航航线。

印度宣布已与中国达成共识,计划恢复两国间直航航班服务。这一航班自冠病疫情爆发及两国政治关系紧张以来,已中断近5年。

外媒报道,印度外交部星期一(1月27日)在声明中表示,印度一位高级特使访问北京期间,双方“原则上同意”恢复直航航线。 

新闻来源:联合早报

反应
 
 

相关新闻

南洋地产