Deepseek“一针刺破天”！

你的位置：国际站手机版 > 新闻动态 > Deepseek“一针刺破天”！

新闻动态

Deepseek“一针刺破天”！

发布日期：2025-02-05 06:31 点击次数：75

就在刚刚，DeepSeek已经登顶了中国和美国的应用商店，排名第一，将ChatGPT一举超越。

这个历史性的时刻，至少在目前十年内绝无仅有。

外媒纷纷如临大敌地写道：中国的新AI模型，正在威胁美国的主导地位。

毫无疑问，中国在没有数十万张H100的情况下，凭借着多项令人瞩目的论文和项目，彻底戳破了美国在AI领域遥遥领先的泡沫。

展开剩余91%

而美国同样也将会吸收这些新成果，并继续创造自己的技术突破。

LLM的开发成本正在大幅降低，对大规模专用硬件的依赖也在相应减少；新技术所带来的领先优势，甚至只能维持几个月甚至几周。

对此，纽约大学教授马库斯也在第一时间发表长文断言：当前阶段的「AI霸权」之争已经结束！

「美国没赢，中国也没赢。」

全球「AI霸权」之争结束，中美战成平局

史上首次，DeepSeek登顶中美AppStore！NYU教授：全球「AI霸权」之争已结束

这是震惊中外的重大事件

DeepSeek之所以像原子弹一样引起美国巨大震动，因为：

第一，美国芯片卡不了脖子了。中国团队证明了小算力也可以做AI大模型，美国的芯片卡脖子瞬间不香了，卡了一个假脖子，卡了一个寂寞：中国即使就是用现有的国内算力，也完全足够支撑做出更完美的大模型出来。

第二，美国想要打造AI霸权的美梦要破碎了。没有AI霸权了。美元本来还想以这个AI霸权作为支撑。这个支撑点突然就没有了。

第三、美国的大算力公司的股价泡沫可能要破灭了。他们已经投入了很多钱，现在看，这就是一个巨大的泡沫，如果泡沫破灭，多少投资打水漂，六百万美元就可以做100亿美元的事情。那动不动就上万亿美元的市值，还能不能支撑得住是未知数。如果互联网巨头，人工智能巨头们的股价下跌，会对美国股市产生极大的震动。由此对美国金融市场产生连锁反应。而且这个没法救市。

第四、未来很多小公司可能也会冲进来做领域的大模型。而且做得比大公司更好，这是完全有可能的。这些领域小公司，都有多年的积累，懂得业务规律。懂得如何优化模型。这对大AI公司的冲击，可能造成趋势不可逆转的巨大伤害。

第五，其实美国还想以强大的AI建立新的军事科技力量，但现在AI帝国被推倒了。AI＋军事霸权也不是那么有力量了。最近被我们国家的机器狼，机器狗，搞得有点心慌慌了。

第六、直接影响美国5000亿美元AI投资可能找不到落地的点了。在我国六代机等军事科技创新面前，美国其实军事已经硬不起来了。唯一盼望的就是把AI霸权再支楞起来。5000亿美元投资AI，就是这个逻辑，也是为了在未来延续美国霸权体系而已。现在，这5000亿美元，似乎也不好找到落脚点了，投资数据中心算力？没用了。

第七，开启了建模仿真新时代。以前建模仿真也很重要，但这次黑天鹅事件，完全把建模能力凸显到更高的地位。这会引发社会的全面思考：为何建模能力如此重要？如何提升个人或团队的建模能力？

第八，开源给全世界，意味着世界多个角落都有了先进的AI，这会彻底掀翻资本型AI，一点幻想都不留了。这是群狼战法，可以把企图搞垄断的大笨象，大肥猪资本AI都杀死。这个开源策略真的妙得很呢。

英伟达美股盘前跌幅一度达到 10.39%，ASML 跌幅则为 10.59%，台积电跌幅则来到了 9.8%，逼近两位数。资本市场对DeepSeek的反应真的是非常迅速的。

还有一点需要指出，就是中美AI竞赛，特朗普刚扣动了5000亿美元投资AI的信号枪，就已经在士气上、舆论上和技术上败下来阵来了，这就好比足球场上裁判刚开始吹哨开球，发球方一个大脚，已经把足球打进球门了。而且更为恐怖的是，这场对决似乎只有中美还在在牌桌上，其他国家已经都不在牌桌上了。这真是一个值得令人深思的现象。

从Deepseek案例我们看到，更高维度更先进的科技对系统的影响是非常之巨大的。我们要好好体会和感受这种力量。为下一次系统升维积蓄能量和信心。

展望未来，行百里者半九十，人工智能的路其实还不到十里，未来还有很多路要走。大语言模型，还只是模型里面的一个类别而已，一个大一点的应用场景而已，它是对存在于互联网的知识信息进行有效提取。它只是一个互联网信息提取模型。真正千变万化的是各领域系统的模型的构建。人工智能新时代，一定是各领域系统模型的千树万树梨花开。

——数学博士惑明

来自东方的神秘力量

DeepSeek持续引发热议。它的影响力不断扩散，不仅超越了ChatGPT，还登上了苹果应用商店免费榜榜首，在西方科技界掀起了惊涛骇浪。DeepSeek为何如此厉害？今天就为你总结五点原因。

第一，重塑算力格局，引发西方震动。DeepSeek仅用2000张GPU，就成功训练出了能与OpenAI OE相媲美的大模型。这一成果，让英伟达以及耗费数百亿美金购置GPU的微软、甲骨文等科技巨头都感受到了巨大压力。算力竞争是规模定律的关键环节，也是我国芯片领域长期被“卡脖子”的痛点。而DeepSeek打破了这种依赖大规模算力比拼的传统格局，在国内芯片领域还未取得突破性进展的情况下，为我们追赶甚至超越美国AI技术带来了新的曙光。

第二，DeepSeek完全开源，给业界开源大模型带来了强烈冲击。Meta的CEO扎克伯格为此连夜召开会议，要求公司所有AI工程师深入研究DeepSeek。因为DeepSeek仅仅花费了约600万美元的高管薪酬成本，就打造出了超越Meta投入数百亿美金研发的Llama大模型。

第三，DeepSeek的论文指出，其关键创新点在于采用了GRPO强化学习机制。这一机制能够跳过模型微调环节，实现模型的自我训练、自我改进与自我进化。这种强大的能力可以让模型迅速自动进化，就像当年的AlphaGo一样，短短几个小时就能完成训练，并且击败人类顶尖围棋高手。

第四，DeepSeek的创始人梁文峰不仅是一位亿万富翁，还怀揣着远大的梦想，为公司设立了通用人工智能AGI的宏伟愿景。同时，在母公司幻方量化的大力支持下，DeepSeek能够心无旁骛地专注于纯粹的AI研究，无需为盈利问题操心，未来发展前景十分广阔。

第五，DeepSeek的价格优势十分突出。它大幅降低了大模型token的价格，每百万文本的价格仅约为OpenAI收费的百万分之一，训练成本更是只有GPT-3的二十分之一。因此，众多美国科研人员、公司和机构纷纷转而选择这个性价比超高的模型。这也使得OpenAI的萨姆·奥特曼深感忧虑，甚至放出要与DeepSeek合作的风声。

由此可见，DeepSeek的中国式创新，对OpenAI、英伟达、Meta、微软、甲骨文等整个西方科技界都产生了巨大的冲击，不愧是来自中国的神秘力量。

开年之际，梁文峰受邀参加总理座谈会

在开年的重要时刻，梁文锋受邀参加总理座谈会，其发言内容发人深省，结合他以往的采访，观点凝练为以下四大要点，值得我们点赞、收藏并持续关注。

01.

开源：构建发展根基的关键路径

在颠覆性科技创新的浪潮下，技术壁垒脆弱不堪，闭关锁国更是不合时宜。以OpenAI为例，即便不开源，被超越也是大势所趋。那么，如何构建自身的核心竞争力？关键在于将价值沉淀于团队成员，助力他们持续成长，积累认知，形成创新活力充沛的组织与文化。真正的优势并非单纯拉开距离，而是自身不断向前奔跑，在竞争中脱颖而出。

02.

从跟随到引领：中国科技创新的角色转变

过往，中国不少企业习惯等待他人的科技创新成果，奉行跟随模仿策略，处于从1到100的阶段，缺乏从0到1的创新突破。梁文锋指出，中国未来应在科技创新领域担当贡献者，而非一味跟随、坐等搭便车。

从0到1的创新难点并非资金不足，而是信心缺失以及创新组织文化难以凝聚高端人才。Dipsy e探索出先进管理机制，内部打破层级与部门隔阂，成员有创新想法时，算力和人员智力调动不受限且无需审批，前提是相关人员对项目感兴趣。这一概念不仅适用于企业管理，更对社会制度适配创新需求有重要启示。

03.

顶尖人才的吸引力：挑战与目标

对于顶尖人才而言，相较于数百万年薪，攻克世界最具挑战性难题、追求宏伟目标更具吸引力。当前，社会提供硬核科技创新的机会较少，导致大量聪明人才未被充分挖掘。Deep sick致力于攻克高难度技术，因而吸引了众多优秀人才。

04.

时代变迁与观念转变：知识与创新的力量

梁文锋回忆，80年代他出生于五线城市，正值改革开放初期，广东赚钱机会多，即便学历不高也能获利，“读书无用论”盛行。但如今再回广东，赚钱不易，观念也发生了深刻变化。若未来社会能让致力于硬核创新的人取得成功，必然会激发大众对硬核科技创新的热情，推动其蓬勃发展。

梁文锋的观点为我们在科技创新与社会发展的道路上指明了方向，无论是企业还是社会，都应从中汲取智慧，积极拥抱变革，为实现创新驱动发展而努力。

Deepseek那么厉害为啥要开源让国外得利？看看DeepSeek V3怎么说？

第一、为了推动 AI 技术的普及和发展：DeepSeek 想着通过把模型开源，把 AI 技术的使用门槛给降低，让更多的研究人员、开发者还有组织能够去访问和使用那些高性能的 AI 模型，这样就能推动整个 AI 社区往前进步啦。

第二、关于成本效益这方面：DeepSeek V3 训练起来成本特别低，就只是其他顶级模型的几分之一而已。这就让中小企业还有学术机构也能承担得起高性能 AI 模型的训练和使用费用了，也促进了 AI 技术被广泛地应用。

第四、在技术创新与共享这块：DeepSeek 一直专注搞技术创新，通过把模型开源，研究人员和开发者就能自由自在地使用、修改和优化模型，能进一步推动 AI 技术向前发展。

第五、从全球化视野来看：DeepSeek 希望借着开源模型，展示出中国 AI 技术的能耐，让中国在全球 AI 领域的影响力变大，推动国际间的技术交流与合作。

第六、社区驱动的创新这方面：开源模式能帮助形成那种社区驱动的开发环境，开发者能够一起贡献代码、分享经验，让技术的迭代和创新速度加快。

第七、关于伦理与公平性这方面：通过开源这种方式，DeepSeek 能保证所有的用户都可以平等地去访问和使用 AI 技术，这样就避免了出现技术被垄断以及不公平的情况。

第八、在教育与培训这块：开源模型给教育和培训带来了好多丰富的资源。它能帮新手很快地熟悉操作，让整体的技术水平都能有所提高。

DeepSeek 的开源策略可不简单，它不光能让技术发展得又快又广，而且还能把使用的门槛降低，推动全球范围内的 AI 创新和合作。虽然有些国外的模型选择闭源，可 DeepSeek 这种开放的态度给全球的 AI 社区带来了新的机会和难题。

按照DeepSeek 给我们的答案，深度求索（DeepSeek）公司选择开源其人工智能模型，可能是基于多方面的考虑。

开源可以促进技术的透明度和可信度，让更多的开发者和研究者能够审查、学习和改进模型，从而推动整个领域的发展。此外，开源也有助于构建一个更加活跃的社区，通过集体智慧来解决复杂问题，并加速创新。

虽然国外一些模型选择闭源，但这并不妨碍开源模型在全球范围内的应用和受益。开源并不意味着失去控制或利益，相反，它可以通过建立标准、吸引合作伙伴和用户，以及通过提供服务和支持来创造商业价值。深度求索可能认为，通过开源，可以更好地展示其技术实力，吸引人才，以及与全球的研究机构和企业建立合作关系，从而实现更广泛的影响和更长远的利益。

发布于：广东省

上一篇：千城胜景｜新疆吉木萨尔：冬日雪境邂逅雾中幻景下一篇：《南沙打造美丽广州城市样板行动方案》正式印发南沙全力建设美丽湾区示范