国际财经

DeepSeek和OpenAI惨了? 50美元超低成本AI顶尖模型震撼曝光

〔华盛顿8日讯〕DeepSeek横空出世引起市场关注,不过现在被誉为“AI教母”的知名华裔美籍科学家李飞飞领导的团队,竟以低于50美元(约222令吉)的云端运算成本,成功训练出名为“s1”的人工智能推理模型。

综合中媒报道,此模型在数学和编码能力测验中的表现,据称媲美OpenAI o1和DeepSeek R1等尖端推理模型。

报道指出,李飞飞团队的s1模型并非从头训练,而是建立在阿里巴巴的Qwen2.5 和 Google DeepMind的Gemini 2.0 Flash Thinking的基础之上。

李飞飞团队搜集了1000个精心挑选的问题及其解答,并透过记录 Gemini 2.0 Flash 的思考过程,建立训练资料集,利用这些资料,微调了Qwen2.5-32B-Instruct模型,创造出s1。

《财联社》报道,中国某知名大模型公司CEO表示,李飞飞团队的成就实际上是利用从Google模型中撷取的1000个样本来微调通义千问模型。这种微调的成本固然低廉,但其优异表现仍有赖于既有模型的基础。

李飞飞团队的这项研究引起业界关注,因仅需20美元的投入和半小时的训练时间,就能达到与OpenAI等公司数百万美元成果相媲美的效果,但中媒《每日经济新闻》指出,50美元是否包含了其他数据、设备、消融实验等费用,还要打个问号,正如DeepSeek-V3不到600万美元(约2664万令吉)的训练成本,其实也只包含了训练时的GPU算力费用。

新闻来源:自由时报

反应

 

国际财经

担忧隐私风险 加拿大政府禁用DeepSeek

(渥太华8日讯)加拿大联邦政府禁止了中国软件公司DeepSeek上个月发布的一款聊天机器人应用程式。

保护政府网络数据

政府信息总监多米尼克·罗雄在彭博看到的一封给联邦政府部门的电邮中写道:“由于不当收集和保留敏感个人信息会带来严重的隐私问题,为了保护政府网络和数据,建议各部门和机构限制在政府设备上使用DeepSeek聊天机器人。”

多米尼克·罗雄在周四传阅的备忘录中表示,负责政府信息技术网络的加拿大共享服务部,已在其支持的所有设备上限制使用这款应用。

他敦促其他部门在其网络和设备上“考虑屏蔽该应用程式和网站”。

根据周四提出的跨党派法案,美国也希望在政府发放的设备上禁用DeepSeek。

支持该法案的议员表示,美国人正在与DeepSeek分享高度敏感的专有信息,有被中国共产党获取的风险。

反应
 
 

相关新闻

南洋地产