大千

AI语言模型 智商测试胜过人类

(北京31日讯)美国加利福尼亚大学洛杉矶分校的研究人员发现,在衡量智力的一系列推理测试中,一个人工智能模型的成绩明显优于普通大学生。

中国媒体《参考消息》30日刊载美国科研成果网报道,参与测试的是自回归语言模型“生成型已训练变换模型3”(GPT-3)。该程序利用深度学习生成类似人类语言的文本。

这项新研究在常识、美国高校入学资格考试成绩和智商这3个方面比较了GPT-3和人类的表现。发表在阿奇夫论文预印本网站上的研究结果显示,在这3个类别中,人工智能语言模型的成绩都高于人类。

研究小组说,GPT-3“通过与生物智能截然不同的路径,被动形成了类似人类类比推理能力的机制,尽管它并未在这方面经过明确训练”。

由美国开放人工智能研究中心研发的GPT-3有很多用途,包括语言翻译和为聊天机器人生成文本等。GPT-3有1750亿个参数,是目前规模最大、功能最强的语言处理人工智能模型之一。

反应

 

国际财经

DeepSeek罕见公布更多代码库 中美AI竞赛进一步升级

(北京22日讯)中国人工智能初创企业DeepSeek,计划从下周开始向公众发布关键代码和数据,相比OpenAI等竞争对手,DeepSeek罕见地准备对外开放更多核心技术。

这家成立才20个月的初创公司,上个月凭借精巧的人工智能模型让硅谷大吃一惊,该公司计划向所有开发和研究人员开放代码库。

该公司在X上发帖称,任何人都可以下载、构建或改进广受好评的R1或其他平台背后的代码。

DeepSeek此举进一步推动了人工智能开发的开源,由于其模型在基准测试中的表现优于OpenAI和Meta,这一举措赢得了更多拥护者。

Meta等公司已经向公众开放了自己的模型。OpenAI最初部分开源,但后来放弃了这一使命。

而DeepSeek打算更进一步,公开底层代码、用于创建代码的数据以及开发和管理代码的方式。

此举可能刺激美国和中国的人工智能竞赛升级。通过无偿分享代码秘密,DeepSeek将推动人工智能技术得到更广泛的应用。

DeepSeek周五在X上发帖称,“接下来一周,会陆续开源5个代码库,毫无保留地分享我们微小但真诚的进展”。

反应
 
 

相关新闻

南洋地产