国际财经

中国AI大模型引硅谷巨头震撼 Meta员工:内部出现恐慌

(华盛顿26日讯)中国AI大模型深度求索“DeepSeek”近日陆续推出“DeepSeek-V3”和“DeepSeek-R1”两款AI大模型,标榜成本低廉,性能可与OpenAI比肩,让硅谷一片震撼,甚至有Meta员工匿名发文称,内部出现恐慌心态,工程师开始连夜尝试复制DeepSeek的技术,探寻可能的成果。不过,该文章并未获得官方出面回应。

《每日经济新闻》报道,Scale AI创始人Alexander Wang在1月24日的采访中表示,DeepSeek在他们的测试里是表现最好的,与美国最好的模型相当。此前,Alexander Wang曾评价称,DeepSeek-V3是中国科技界带给美国的苦涩教训,“当美国休息时,中国(科技界)在工作,以更低的成本、更快的速度和更强的实力赶上。”

一名自称Meta员工24日在匿名平台teamblind上的贴文在网络上疯传。他提到,Meta内部因为DeepSeek的模型,已经进入恐慌模式,“工程师们正在疯狂地剖析DeepSeek,并从中复制任何我们能得到的东西。我一点也不夸张。”

据了解,深度求索在2024年12月27日推出开源模型DeepSeek-V3。当时,聊天机器人竞技场(Chatbot Arena)资讯显示,DeepSeek-V3在所有模型中排名第七,在开源模型排第一,也是全球前十中性价比最高的模型。

一个月内,深度求索在20日推出“DeepSeek-R1”推理模型,允许外界在在遵循MIT License的情况下,透过R1训练其他模型。

长期为硅谷输出人才的史丹佛大学和Epoch AI的研究人员在2024年中发表一项研究表明,到2027年,最大型的模型的训练成本将超过10亿美元。Gartner预测,Google、Microsoft和AWS等超大规模企业到2028年止,仅在AI服务器上的支出就将高达5000亿美元。

然而,“DeepSeek”的训练成本并不昂贵,Noah''s Arc资本管理公司表示,DeepSeek-V3模型有可能彻底改变训练和推理领域的游戏规则。知名财经记者Holger Zschaepitz 25日提到,DeepSeek以极低的价格建立了一个突破性的AI模型,而且没有使用尖端芯片,这让人们怀疑。该行业数千亿美元资本支出的效用。

新闻来源:ETtoday新闻云

反应

 

国际

大力推荐DeepSeek《黑神话》制作人:国运级别的科技成果

(北京27日讯)中国人工智能初创公司“深度求索”(DeepSeek)发表的DeepSeek-V3、DeepSeek-R1两款大模型,近期受到大量关注。

澎湃新闻报道,连中国国产“3A电玩”《黑神话:悟空》的制作人冯骥也发文大力推荐,甚至直言DeepSeek可能是“国运级别的科技成果”。

据报道,冯骥26日在微博发文提到,他使用V3已有1个月,R1则是用了5天,“不得不来发这条微博,先讲一句暴论:DeepSeek可能是个国运级别的科技成果”。

冯骥指出,DeepSeek做到了强大(比肩O1的推理能力,暂时没有之一)、便宜(参数少,训练开销与使用费用小了一个数量级)、开源(任何人均可自行下载与部署,提供论文详细说明训练步骤与窍门,甚至提供了可以运行在手机上的mini模型)、免费(官方目前提供的服务完全免费,任何人随时随地可用)、联网(暂时唯一支持联网搜索的推理模型)、本土(深度求索是一家很小规模的年轻中国公司)。

冯骥认为,如果有一个人工智能大模型做到他提到的任何一条,都是超级了不起的突破,“但DeepSeek全部、同时做到了这六条,如果这都不值得欢呼,还有什么直得欢呼?”

冯骥还在贴文内附上了DeepSeek的连结,推荐网民马上体验,“使劲用,疯狂用,尝试用它基本取代传统搜索。请想象你已经认识每个领域的顶尖专家,而且他们都是你随时在线的好朋友,把所有可能需要‘请教别人’的问题,都拿去先问它,无论是构建一个复杂函数,搞清楚附近哪个游泳池最好,检查合同里的法律陷阱,让新写的歌词再押韵点,或者帮父母确认某个保健品是否真的有效”。

他写道:“希望DeepSeek R1会让你对当前最先进的人工智能祛魅,让AI逐渐变成你生活中的水和电。这样震撼的突破,来自一个纯粹的中国公司。知识与信息平权,至此又往前迈出了坚实的一步。”

新闻来源:Ettoday新闻云

反应
 
 

相关新闻

南洋地产