灼见

打造DeepSeek成第二个华为/魏开星

中国自改革开放以来,工业化加速,尤其是制造业壮大,是从“三来一补”到合资合作;从引进外资“独资”企业到“以市场换技术”逐步实现的。到了本世纪初,国家提出“2025中国制造”计划,表明要升级制造业技术水准,创立国产品牌,从低端产业往中高端进发。在这个过程中,内地诞生了不少具独创精神及特色品牌的大厂。

按2023年的营收数额排名,世界500强中的中国企业有133家,里面有不少是高新科技及“互联网+”企业,其中以华为最为突出。这间从通讯设备起家的民企,如今已然成为中国智能制造的翘楚。

据华为高层日前透露,该公司去年全年销售收入超过8600亿元人民币,几乎回到被美国制裁前的巅峰。

创新企业要有原创

华为作为一间民企,之所以成为美国政府重重打压的对象,是因为它是真正的创新企业,创新从底层逻辑开始。从根本上说,中国要不被卡脖子,不担心“脱钩断链”,必须要有自己的原创。

在以人工智能为特征的第四次产业革命,中国要不再错过、不落伍,就不能在美国等西方世界划定的框架及标准中亦步亦趋。在中美事关国运之争的当口,中国的一家初创企业DeepSeek(深度求索),只用了560万美元的训练费用,就成功推出了人工智能大模型R1,其效果与美国号称世界第一的OpenAI公司处于同一水平,结果轰动了世界。

这间公司的创始人梁文峰被邀请参加国务院总理李强的座谈会中谈到,中国企业不能坐等搭便车,而要成为创新的参与者、贡献者,一鸣惊人,引发深思。这种思想与华为的创始人任正非所思所想所为很是契合。

因此,笔者以为DeepSeek具备成为第二个华为的潜质。何况,DeepSeek已经在运用华为的升腾910C芯片在进行人工智能大模型的训练了,两家公司将来会有更紧密的合作。

重视人才高薪笼络

除了强调原创精神之外,DeepSeek还有几点做法与华为十分类似。 一是重视人才,并以高薪笼络。

华为重视人才培养和引进,拥有一支高素质、专业化和国际化的员工队伍,这为华为不断创新和发展提供了有力的人才支撑。

据中国基金报报道,DeepSeek目前在BOSS直聘等平台发布了52个在招职位,涵盖深度学习研究员、核心系统研发工程师及资深UI设计师等。其中,深度学习研究员岗位的薪资水平为50—80k(14薪),招聘要求是在校或者应届的硕士生。这意味着,若按照最高月薪8万元计算,应届生入职DeepSeek,年薪就可达到112万元。

此外,核心系统研发工程师(校招)薪资范围6万元至9万元,最高年薪126万元;大模型全栈工程师薪资范围5万元至8万元,最高年薪112万元。

二是主创人员为本土名校生。DeepSeek由量化资管巨头幻方量化创立,团队约有150人,成员多为本土人才,创始人是来自广东省湛江市代管的县级市吴川市的 “85后”梁文锋。

主创人员都在35岁以下,全部是内地名校毕业的大学生及还没有毕业的硕士、博士生。总之,都是国内自己培养的,没有留学外国的“海龟”,包括梁文峰自己,毕业于浙江大学。这样教育背景所形成的企业文化,可免受美国现有硅谷、华尔街等框框的约束,可走美国人工智能产业不一样的路子。

不上市不对外融资

三是DeepSeek将不上市、不对外融资。据媒体披露,梁文峰已有此想法。如此一来,该公司可免遭资本市场、私人投资尤其是外国资本的摆布,可心无旁骛地贯彻国家在人工智能领域的战略构想,而不是单单以盈利为出发点。

中国的人工智能产业发展方向,是为本国、为全球南方、为全人类造福,让那些发展中国家、工业欠发达国家、技术相对落后的国家也能在人工智能创新及运用方面有所得益。

从DeepSeek公布人工智能大模型采取完全开源的做法,可以应证创始团队的格局与境界。

华为公司将鸿蒙系统的底层核心架构无偿捐献给国家,并为国家信息安全、国计民生的行业提供底层技术支持而备受尊敬。从这点看,DeepSeek已具备成为第二个华为的基础。

反应

 

亚洲周刊专区

DeepSeek大颠覆 梁文锋改变AI游戏规则

作者:宋阳标

中国人工智能“深度求索”(DeepSeek)公司横空出世,广东省湛江长大的梁文锋,联同年轻的本土团队,以极低成本训练出媲美ChatGPT的AI,全部开源,全球免费使用,改变人工智能的游戏规则,颠覆美国霸权,登全球下载榜首,美科技股蒸发逾1兆美元。美官员诬指DeepSeek偷窃知识产权,但是美科企旋即改变敌对立场,英伟达、英特尔、微软等都连接DeepSeek。特朗普拟加大封锁华芯片,但梁文锋早就应变,改用国产芯片。

中国人工智能“深度求索”(DeepSeek)公司横空出世,以500万美元成本训练出能力媲美ChatGPT的人工智能,全部开源,全球免费使用,改变人工智能(AI)的游戏规则,颠覆美国霸权,登上全球下载的榜首,推倒制裁和资本密集的“小院高墙”,美科技股应声蒸发逾1兆美元。

美官员诬指“深度求索”偷窃知识产权,美科企开始持敌对态度,但是旋即改变立场,英伟达、英特尔、微软等都将连接“深度求索”。

特朗普称它为敲响美国科技业的警钟,拟加大对华封锁芯片,但是“深度求索”创办人梁文锋早就应变,改用国产芯片,打造中国人工智能全自主的生态系统。挑战OpenAI霸主地位的中国人工智能公司DeepSeek团队,成员超过一半是“95后”,平均年龄35岁,都是中国式学霸。

1月20日,“深度求索”宣布发布其R1模型,超出任何人的预期,美国资本市场大震荡,英伟达(NVIDIA)一夜之间丢掉5500亿美元市值,暴跌17%,市值被削掉5888.6亿。纳斯达克综合指数3.07%,台积电、博通公司、超微半导体等科技股也集体暴跌。

“深度求索”的出现,改变了人工智能的赛道,中美互相领先将成为常态,风险投资家马克安德森指“DeepSeek R1是人工智能的斯普特尼克时刻”。

据“深度求索”表示,DeepSeek-V3和DeepSeek-R1这两个模型受到硅谷高管和美国科技公司工程师的一致好评,与OpenAI公司和Meta公司最先进的模型不相上下。

成美国下载平台冠军

“深度求索”发布后不久,就成为美国苹果及安卓下载平台的冠军。自1月26日在苹果商店的140个国家登顶,全球下载量1周内逾1亿,超过OpenAI的ChatGPT同期的表现。印度成为“深度求索”下载量最多的区域,占总下载量的15%以上。美国下载量约占总量的8%。

1月27日,美国总统特朗普表示:“我一直在阅读有关中国和中国一些公司的消息,特别是有一家公司想出了一种更快、更便宜的人工智能方法。如果这是真的,那很好,我认为这是一个非常积极的发展。这意味着,你不必花费数十亿美元,也可以得到同样的解决方案。中国公司发布的“深度求索”,应该为我们的行业敲响警钟,我们需要在竞争中集中精力取胜。”

特朗普于1月31日会见了英伟达总裁黄仁勋,被指是向他施压停止向中国供应特供版的人工智能芯片。消息同时传出,美国政府正准备进一步限制出口芯片,以确保美国与盟国保有先进的运算能力。

然而,“深度求索”的创办人梁文锋似乎早就料到,《快科技》、《腾讯网》等媒体爆出“深度求索”正积极筹备适配国产图形处理器(GPU),绕过英伟达的底层技术,实现科技上的完全自主,以应对下一波的制裁,继续部署人工智能发展战略。梁文锋的计划一旦成功,中国将可实现人工智能全生态圈的闭环发展,完全自给自足,瓦解美国制裁令的攻击。

“深度求索”是杭州深度求索人工智能基础技术研究有限公司(下称深度求索)旗下的大语言AI模型,该公司专注于通用人工智能(AGI)的研发与应用,由梁文锋于2023年7月创办,并通过多层股权结构实际控制,也是著名的“杭州六小龙”之一。

“深度求索”通过自研架构与高效训练方法,试图在性能、成本与可控性之间找到平衡点,其发展路径融合了技术理想主义(AGI长期目标)与商业现实主义(B端落地)。

小镇高考状元

梁文锋1985年出生于广东省湛江市。2002年,17岁时以湛江市吴川县一中“高考状元”的成绩,考上浙大本科电子信息工程专业,2007年,梁文锋在同系读研究生,获得硕士学位。

2013年,他与浙大同学徐进共同创立了杭州雅克比投资管理有限公司,2015年成立杭州幻方科技有限公司。2023年,他创办“深度求索”,专注于通用人工智能领域。

在大学求学期间,梁文锋与同学一起使用机器学习等技术,探索全自动量化交易。2015年,他和同学成立“幻方量化”基金公司。4年后,“幻方量化”的资金管理规模就突破百亿元。

在资本市场的大潮中,“幻方量化”依靠高频量化策略取得令人瞩目的成绩。2016年10月,“幻方量化”推出第一个人工智能模型,第一份由深度学习生成的交易仓位上线执行。

到次年底,“幻方量化”几乎所有的量化策略都采用人工智能模型计算。2018年,“幻方量化”正式确立了以人工智能为核心的发展策略。

梁文锋创办人工智能的企业,和他在资本市场的深入有关。

随着“幻化量方”业务的快速扩展,其计算模型的算力瓶颈逐渐显现。梁文锋开始带队研发萤火系列训练平台。梁文锋团队研发“萤火二号”的投入,从一号的2亿元人民币(约1.22亿令吉)增加到10亿元,搭载了约1万张英伟达的A100显卡。2021年,“幻方”的资产管理规模突破千亿大关,跻身中国量化私募领域的“四大天王”之列。

招幕优秀技术人才

梁文锋在创办“深度求索”之前,就已经在人工智能领域积累了丰富的经验。为了招募优秀的技术人才,梁文锋亲自走访各大高校和科研机构,向他们介绍自己的创业理念和技术愿景。

他的真诚和热情打动了许多人,一批优秀的技术人才纷纷加入“深度求索”的团队。

“深度求索”的主创团队,汇聚了一批来自不同领域的顶尖人才。除了创始人梁文锋之外,团队还包括机器学习专家、计算机视觉专家、自然语言处理专家。

这些专家加入,有效提升了“深度求索”模型的训练效率和准确性,为“深度求索”在多个领域的应用提供了强大的技术支持。

2023年7月,梁文锋正式创办“深度求索”。在2024年5月,“深度求索”发布混合专家语言模型DeepSeek-V2,并宣布DeepSeek-V2的推理成本下降到每百万token仅1元人民币,约等于GPT-4 Turbo的七十分之一。同年12月26日,“深度求索”宣布上线并同步开源的DeepSeek-V3模型,并公布了53页的训练和技术细节。

模型测算数据显示,DeepSeek-V3虽然文字生成类的任务比较弱,但是其代码、逻辑推理和数学推理能力均名列前茅。(1token约等于1.5个汉字或3个英文字母)

DeepSeek-V3整个训练过程仅用了不到280万个“图形处理器”小时,模型全部训练成本仅为557万美元,这一成本几乎是GPT4训练成本的二十分之一。

2025年1月20日晚,“深度求索”正式发布DeepSeek-R1,该模型在数学、代码、自然语言推理等任务上,性能比肩OpenAI正式版。

技术理想主义者

外界评价“深度求索”创始人梁文锋是一位技术理想主义者,提供了目前中国科技界特别稀缺的一种声音:他是少有的把“是非观”置于“利害观”之前,并提醒我们看到时代惯性,把“原创式创新”提上日程的人。

梁文锋认为:因为我们觉得现在最重要的是参与到全球创新的浪潮里去。过去很多年,中国公司习惯了别人做技术创新,中国拿过来做应用变现,但是这并非一种理所当然。这一波浪潮里,我们的出发点,就不是趁机赚一笔,而是走到技术的前沿,去推动整个生态发展。

中国逐步成贡献者

梁文锋指出:我们认为随着经济发展,中国也要逐步成为贡献者,而不是一直搭便车。

同为杭州六小龙之一的《黑神话·悟空》的制作人、“游戏科学”创始人冯骥发评力挺“深度求索”,称“深度求索”是国运级别的科技成果。

冯骥在经过使用1个月之后,给出了6个方面的高度评价:
1、强大。比肩o1的推理能力,暂时没有之一。
2、便宜。参数少,训练开销与使用费用小了一个数量级。
3、开源。任何人均可自行下载与部署,提供论文详细说明训练步骤与窍门,甚至提供了可以运行在手机上的细小版模型。
4、免费。公司目前提供的服务完全免费,任何人随时随地可用。
5、联网。暂时唯一支持联网搜索的推理模型(OpenAI的o1目前还不支持)。
6、本土。“深度求索”是一家规模很小的年轻中国公司,由没有海外经历,甚至没有资深从业经验的本土团队开发完成。

冯骥认为,如果有一个人工智能大模型做到了以上的任何一条,都是超级了不起的突破。

“深度求索”的核心开发团队,成员来自北京大学、清华大学、北京邮电大学、北京航空航天大学、中山大学等学校,无一来自于留学群体。

研发团队没有海归

梁文锋说,DeepSeek-V2研发人才都是本土的,没有海归,人工智能前50名顶尖人才可能不在中国,但是“也许我们能自己打造这样的人”。

从事研究无人驾驶技术的北京人工智能专家于宏啸认为,“深度求索”的成功,说明中国还是可以有很多创新性的东西。他说,中国创新的一直不是土壤的创新,“深度求索”使大家感觉到中国的创新也是可以突破的,另外“我们还是更爱用中国的大模型,至少我们去提供数据,我们还是很愿意的。”

对于外界关于创新成本太高、“深度求索”能不能承受的疑问,梁文锋回答:创新的成本肯定不低,过去那种拿来主义的惯性也和过去的国情有关。但是现在,你看无论中国的经济体量,还是字节、腾讯这些大厂的利润,放在全球都不低。我们创新缺的肯定不是资本,而是缺乏信心,以及不知道怎么组织高密度的人才实现有效的创新。

梁文锋说:“过去30年,我们都只强调赚钱,对创新是忽视的,创新不完全是商业驱动的,还需要好奇心和创造欲,我们只是被过去那种惯性束缚了。”

新闻来源:亚洲周刊

反应
 
 

相关新闻

南洋地产