国际

阿里巴巴发布AI模型 声称超越DeepSeek

(北京29日讯)中国科技公司阿里巴巴星期三(1月29日)发布了其通义千问“Qwen 2.5”人工智能AI模型的新版本,并声称该模型已超越备受赞誉的DeepSeek-V3。

阿里云发布其全新的通义千问 Qwen 2.5-Max超大规模混合专家(MoE)模型的时间较不寻常,正值农历新年第一天,大多数中国人正在放假与家人团聚。这意味著中国AI新创公司深度求索(DeepSeek)过去三周的迅猛崛起,不仅给海外竞争对手、也给国内竞争者带来了压力。

“Qwen 2.5-Max…几乎全面超越了GPT-4o、DeepSeek-V3及Llama-3.1-405B,” 阿里云在微信公众号上发布的一篇公告中说,其指的分别是OpenAI、深度求索和Meta最先进的开源AI模型。

根据介绍,Qwen 2.5-Max使用超过20兆token(AI模型处理的资料单位)的预训练资料及精心设计的后训练方案进行训练。

阿里云说,通义团队分别对Qwen2.5-Max的指令模型版本和基座模型版本效能进行了评估测试。在指令模型测试方面,Qwen2.5-Max在多个基准测试中比肩美国的Claude-3.5-Sonnet模型,几乎全面超越了另外三个美国模型GPT-4o、DeepSeek-V3及Llama-3.1-405B 。

阿里云表示,在基座模型测试方面,通义团队将Qwen2.5-Max与目前DeepSeek V3、Llama-3.1-405B、Qwen2.5-72B进行了对比,而Qwen2.5-Max在所有11项基准测试中全部超越了对比模型。

不过,微信公众号“简约财经”的贴文指出,Qwen 2.5-Max 在发展过程中仍面临着许多挑战和风险,其中包括在技术挑战方面,训练优化过程中的计算资源消耗和时间成本问题,以及模型在复杂任务和多模态融合方面的表现提升需求,都需要进一步的研究和创新来解决。

这篇文章说,在伦理与安全风险方面,Qwen 2.5-Max也面临资料隐私保护、模型偏见避免以及内容真实性和 AI 滥用防范等需要高度重视的问题。

DeepSeek与国内竞争对手

深度求索1月10日发布了其DeepSeek-V3模型驱动的AI助手,随后在1月20日推出R1模型。这一系列AI模型的新发布震撼了硅谷,并导致科技股重挫。深度求索据称低廉的开发和使用成本,促使投资者开始质疑美国领先AI公司的巨额支出计划。

深度求索的成功也引发了国内竞争对手竞相升级本身的AI模型。

在DeepSeek-R1发布两天后,TikTok母公司字节跳动推出了其旗舰AI模型的更新,并声称该模型在AIME(旨在衡量AI模型对复杂指令的理解和回应能力的一项基准测试)中的表现优于微软支援的OpenAI的o1模型。

这与深度求索的说法相似。深度求索声称其R1模型在多个性能基准测试中可比得上OpenAI的o1。

DeepSeek-V3模型的前身DeepSeek-V2在去年5月发布后,引发了中国AI模型的价格战。

DeepSeek-V2采用开源和空前低廉的价格,导致阿里云宣布对一系列模型的降价幅度最高达97%。

其他中国科技公司纷纷跟进,包括百度以及中国市值最高的互联网公司腾讯。

深度求索的神秘创始人梁文锋在去年7月接受中国媒体《暗涌》(Waves)的罕见采访中表示,该公司「不在乎」价格战,其主要目标是实现AGI(通用人工智慧)。

OpenAI将AGI定义为能够在大多数具有经济价值的任务上超越人类的自主系统。

相较于阿里巴巴等中国大型科技公司拥有数十万名员工,深度求索的运作方式像是研究实验室,其团队主要由来自中国顶尖大学的年轻毕业生和博士生组成。

梁文锋在去年7月的访谈中表示,他认为中国大型科技公司可能不太适合未来的AI产业,并将这些企业的高成本和自上而下的架构,与深度求索采用的精简营运和宽松管理的风格,进行了对比。

“大型基础模型需要持续创新,科技巨头的能力是有限的,” 他说。

新闻来源:Yahoo新闻

反应

 

国际财经

出售资产重建投资组合 阿里巴巴假日季忙不停

(杭州4日讯)虽然许多消费者在假日期间囤货,阿里巴巴集团却一直忙着出售资产,即使需要承受损失。

2025年伊始,这家中国科技公司宣布出售在高鑫零售逾70%的持股,价格较其30亿美元(约135亿令吉)市值有大幅折让。几周前,阿里巴巴同意出售百货业务银泰,料录得亏损13亿美元(约58.50亿令吉)。

节日期间的阿里巴巴交易热潮还包括与易买得的电商平台Gmarket在韩国成立价值40亿美元(约180亿令吉)的合资企业。

阿里巴巴忙着出售资产令参与其中的银行家和其他安排行从中获益。此前,阿里巴巴在5月份发行了创纪录的可转换票据,六个月后,该公司多年来首次公开发行了美元债,同时还发行了离岸人民币债券,规模总计近50亿美元。

试图重振声誉

阿里巴巴在短短半年多的时间里完成了这些交易,这表明阿里巴巴正在重振自2020年以来一直萎靡不振的交易机器,当时政府指责阿里巴巴的垄断行为,并打击科技公司日益增长的影响力。随着整顿行动的结束,中国再次鼓励科技投资以振兴经济并推动人工智能研究。

阿里巴巴在出售高鑫零售持股的声明中将其描述为将非核心资产变现的“好机会”。随着阿里巴巴更紧密地整合其电商业务并寻求筹集资金,未来可能会有进一步的活动。

“最近的非核心资产处置表明,在吴泳铭迈入担任该公司总执行长的第二个年头之际,阿里巴巴明确专注于技术、电子商务和人工智能, ”彭博行业研究凯瑟琳林(译音)称。

阿里巴巴股价周五反弹,涨幅一度高达3%,创下12月24日以来最大涨幅。

反应
 
 

相关新闻

南洋地产