据界面新闻21日报道,1月20日,中共中央政治局常委、国务院总理李强主持召开专家、企业家和教科文卫体等领域代表座谈会,听取对《政府工作报告(征求意见稿)》的意见建议。
此次座谈会上,共有来自不同领域的九位代表先后发言。其中一位80后年轻小伙引起网友的注意!
这家名不见经传的小公司创始人被邀请参加高层座谈会,因为这家公司很不简单,他打破了美国ai大公司描绘的一个神话,也打破了它们的算力霸权。
这家公司叫DeepSeek,来自中国杭州。没有西方风险投资注入,员工均毕业于国内大学的企业。
他的创始人梁文峰,1985年出生于广东湛江。梁文峰的父亲是一名小学老师,而他本人是一位数学建模爱好者。他本人在浙江大学读的电子工程系人工智能方向。
这家公司的崛起,让人们看到了国产AI的无限潜力。
美国方面做了测试,与OpenAI相比,DeepSeek的优势显著。在数学、代码和自然语言推理等任务上,与OpenAI的GPT-4o和GPT-o1正式版表现相当。特别是它在数学能力上,跑分高达90.2%,比GPT-4高出10分以上。
在国际知名AI能力评测机构LiveBench的评比上,这家公司的大模型DeepSeek-R1更是达到了全球第二,仅次于OpenAI 。
这家公司最大的优势是性价比。他用了行业内1/10的成本,做到了行业顶尖性能的90%以上。更让人佩服的是,这家主业是搞量化的公司用副业做出了如此强悍的ai大模型。
杭州这家小公司的出现可以说是上苍给中国ai产业的一个新年礼物,它的成功意义非凡 ,他打破了之前西方ai大公司一直掌握的算力霸权,有力地证明了“算力极限会制约大模型的演进”是一个伪命题。
人脑仅有20瓦功率却拥有600万亿神经元突触,而1000B参数的大模型推理消耗功率需上千瓦,训练消耗更是达百万瓦级别,这说明硬件、架构、算法还有巨大的工程优化空间。
这事儿的意义就相当于当年研发氢弹,美国走的是一种路线,中国的天才科学家于敏走了另一种路线。谁说到达罗马的大路永远只有一条?
起初,欧美对杭州这家公司的成果并不相信。我们花了几百个亿美金,花了这么大代价搞出的东西,你一个小公司凭什么能做出来,还花了这么点钱?
但是形势比人强,欧美各种机构反复测试来测试去,最后发现这一切是真的,而且整个性能指标都是很棒。海外知名科技博主reddy评价,聪明的中国人创造了伟大,开放和透明的技术。
DeepSeek团队仅有139名研发人员,是OpenAI的十分之一。创始人梁文峰刚满40岁,此前雷军千万年薪挖的95后天才AI少女也是团队研发成员。
DeepSeek的出现,让世界看到了中国AI的创新力和发展潜力。它以创新的方式,在AI大模型发展上贡献了“中国版本”,为中国AI在全球舞台上赢得了一席之地。
素材来源官方媒体/网络新闻
