国际财经

阿里巴巴发布新AI模型 可视觉解读人类情绪

(杭州13日讯)阿里巴巴发布了一款据称可以解读人类情绪的人工智能模型,意在挑战OpenAI的最新产品。

在两场演示中,阿里巴巴通义实验室的研究人员展示了他们的新开源模型R1-Omni,这款人工智能工具可以推断视频中人物的情绪状态,并描述衣服和环境。它为所谓的计算机视觉增加了另一层理解,是另一开源模型HumanOmni的增强版。

1月份DeepSeek一鸣惊人的亮相加速了阿里巴巴在人工智能领域的步伐,这家电子商务巨头目前正在多个领域推出新的人工智能工具和应用程序。其对标DeepSeek的模型“通义千问”成为了苹果在中国大陆市场的AI合作伙伴,为中国iPhone用户提供人工智能相关服务,目前该公司还打算与OpenAI一较高下。用户可以在Hugging Face上免费下载R1-Omni。

今年早些时候,OpenAI推出了GPT-4.5模型,该公司称这款模型能够更好地识别和响应用户书面提问中的微妙线索。但该模型价格不菲:最初仅向月费200美元的付费用户开放。而阿里巴巴声称不收取任何费用,并允许所有人使用其新模型。

演示中仅展示了R1-Omni能够给出“快乐”或“愤怒”等一般情绪描述,但它从视觉线索中提取这些描述的能力非常重要。

 
 

 

反应

 

国际财经

DeepSeek劲敌? 阿里发布开源模型QwQ-32B

(北京6日讯)阿里巴巴AI To C业务旗下AI应用阿里通义在6日正式发布最新的开源推理模型通义千问QwQ-32B,其官方介绍称,透过大规模强化学习,千问QwQ-32B在数学、代码及通用能力上进步飞跃,整体性能比肩DeepSeek-R1,同时大幅降低部署使用成本,在消费级显卡上能实现本地部署。

使用者已可免费下载及商用QwQ-32B模型,或透过网页版Qwen Chat体验,该模型也将免费上架通义App。

阿里通义团队表示,QwQ-32B模型针对数学和编程任务、通用能力分别进行2轮大规模强化学习,在32B的模型尺寸上获得推理能力提升,印证了大规模强化学习(Reinforcement Learning,一种机器学习技术)可显着提高模型性能。

该团队指,千问QwQ-32B能提供极强的推理能力,以及满足更低的资源消耗需求,背后关键在于强化学习。该团队表示,希望能够证明强大的基础模型叠加大规模强化学习,也许是一条通往通用人工智能(AGI)的可行之路。

此外,QwQ-32B模型中还集成了与智能体(AI Agent,指的是能够自主做出决策、完成行动,且毋需人类介入的人工智慧)相关的能力,能在使用工具的同时进行批判性思考,以及根据环境回馈调整推理过程。

受此消息影响,6日阿里巴巴集团港股早盘大幅高开涨逾6%,截至午盘涨逾7%。

新闻来源:世界新闻网

反应
 
 

相关新闻

南洋地产