你的位置:国际站手机版 > 新闻动态 > Deepseek“一针刺破天”!

新闻动态
Deepseek“一针刺破天”!
发布日期:2025-02-05 06:31    点击次数:74

就在刚刚,DeepSeek已经登顶了中国和美国的应用商店,排名第一,将ChatGPT一举超越。

这个历史性的时刻,至少在目前十年内绝无仅有。

外媒纷纷如临大敌地写道:中国的新AI模型,正在威胁美国的主导地位。

毫无疑问,中国在没有数十万张H100的情况下,凭借着多项令人瞩目的论文和项目,彻底戳破了美国在AI领域遥遥领先的泡沫。

展开剩余91%

而美国同样也将会吸收这些新成果,并继续创造自己的技术突破。

LLM的开发成本正在大幅降低,对大规模专用硬件的依赖也在相应减少;新技术所带来的领先优势,甚至只能维持几个月甚至几周。

对此,纽约大学教授马库斯也在第一时间发表长文断言:当前阶段的「AI霸权」之争已经结束!

「美国没赢,中国也没赢。」

全球「AI霸权」之争结束,中美战成平局

史上首次,DeepSeek登顶中美AppStore!NYU教授:全球「AI霸权」之争已结束

这是震惊中外的重大事件

DeepSeek之所以像原子弹一样引起美国巨大震动,因为:

第一,美国芯片卡不了脖子了。中国团队证明了小算力也可以做AI大模型,美国的芯片卡脖子瞬间不香了,卡了一个假脖子,卡了一个寂寞:中国即使就是用现有的国内算力,也完全足够支撑做出更完美的大模型出来。

第二,美国想要打造AI霸权的美梦要破碎了。没有AI霸权了。美元本来还想以这个AI霸权作为支撑。这个支撑点突然就没有了。

第三、美国的大算力公司的股价泡沫可能要破灭了。他们已经投入了很多钱,现在看,这就是一个巨大的泡沫,如果泡沫破灭,多少投资打水漂,六百万美元就可以做100亿美元的事情。那动不动就上万亿美元的市值,还能不能支撑得住是未知数。如果互联网巨头,人工智能巨头们的股价下跌,会对美国股市产生极大的震动。由此对美国金融市场产生连锁反应。而且这个没法救市。

第四、未来很多小公司可能也会冲进来做领域的大模型。而且做得比大公司更好,这是完全有可能的。这些领域小公司,都有多年的积累,懂得业务规律。懂得如何优化模型。这对大AI公司的冲击,可能造成趋势不可逆转的巨大伤害。

第五,其实美国还想以强大的AI建立新的军事科技力量,但现在AI帝国被推倒了。AI+军事霸权也不是那么有力量了。最近被我们国家的机器狼,机器狗,搞得有点心慌慌了。

第六、直接影响美国5000亿美元AI投资可能找不到落地的点了。在我国六代机等军事科技创新面前,美国其实军事已经硬不起来了。唯一盼望的就是把AI霸权再支楞起来。5000亿美元投资AI,就是这个逻辑,也是为了在未来延续美国霸权体系而已。现在,这5000亿美元,似乎也不好找到落脚点了,投资数据中心算力?没用了。

第七,开启了建模仿真新时代。以前建模仿真也很重要,但这次黑天鹅事件,完全把建模能力凸显到更高的地位。这会引发社会的全面思考:为何建模能力如此重要?如何提升个人或团队的建模能力?

第八,开源给全世界,意味着世界多个角落都有了先进的AI,这会彻底掀翻资本型AI,一点幻想都不留了。这是群狼战法,可以把企图搞垄断的大笨象,大肥猪资本AI都杀死。这个开源策略真的妙得很呢。

英伟达美股盘前跌幅一度达到 10.39%,ASML 跌幅则为 10.59%,台积电跌幅则来到了 9.8%,逼近两位数。资本市场对DeepSeek的反应真的是非常迅速的。

还有一点需要指出,就是中美AI竞赛,特朗普刚扣动了5000亿美元投资AI的信号枪,就已经在士气上、舆论上和技术上败下来阵来了,这就好比足球场上裁判刚开始吹哨开球,发球方一个大脚,已经把足球打进球门了。而且更为恐怖的是,这场对决似乎只有中美还在在牌桌上,其他国家已经都不在牌桌上了。这真是一个值得令人深思的现象。

从Deepseek案例我们看到,更高维度更先进的科技对系统的影响是非常之巨大的 。我们要好好体会和感受这种力量。为下一次系统升维积蓄能量和信心。

展望未来,行百里者半九十,人工智能的路其实还不到十里,未来还有很多路要走。大语言模型,还只是模型里面的一个类别而已,一个大一点的应用场景而已,它是对存在于互联网的知识信息进行有效提取。它只是一个互联网信息提取模型。真正千变万化的是各领域系统的模型的构建。人工智能新时代,一定是各领域系统模型的千树万树梨花开。

——数学博士 惑明

来自东方的神秘力量

DeepSeek持续引发热议。它的影响力不断扩散,不仅超越了ChatGPT,还登上了苹果应用商店免费榜榜首,在西方科技界掀起了惊涛骇浪。DeepSeek为何如此厉害?今天就为你总结五点原因。

第一,重塑算力格局,引发西方震动。DeepSeek仅用2000张GPU,就成功训练出了能与OpenAI OE相媲美的大模型。这一成果,让英伟达以及耗费数百亿美金购置GPU的微软、甲骨文等科技巨头都感受到了巨大压力。算力竞争是规模定律的关键环节,也是我国芯片领域长期被“卡脖子”的痛点。而DeepSeek打破了这种依赖大规模算力比拼的传统格局,在国内芯片领域还未取得突破性进展的情况下,为我们追赶甚至超越美国AI技术带来了新的曙光。

第二,DeepSeek完全开源,给业界开源大模型带来了强烈冲击。Meta的CEO扎克伯格为此连夜召开会议,要求公司所有AI工程师深入研究DeepSeek。因为DeepSeek仅仅花费了约600万美元的高管薪酬成本,就打造出了超越Meta投入数百亿美金研发的Llama大模型。

第三,DeepSeek的论文指出,其关键创新点在于采用了GRPO强化学习机制。这一机制能够跳过模型微调环节,实现模型的自我训练、自我改进与自我进化。这种强大的能力可以让模型迅速自动进化,就像当年的AlphaGo一样,短短几个小时就能完成训练,并且击败人类顶尖围棋高手。

第四,DeepSeek的创始人梁文峰不仅是一位亿万富翁,还怀揣着远大的梦想,为公司设立了通用人工智能AGI的宏伟愿景。同时,在母公司幻方量化的大力支持下,DeepSeek能够心无旁骛地专注于纯粹的AI研究,无需为盈利问题操心,未来发展前景十分广阔。

第五,DeepSeek的价格优势十分突出。它大幅降低了大模型token的价格,每百万文本的价格仅约为OpenAI收费的百万分之一,训练成本更是只有GPT-3的二十分之一。因此,众多美国科研人员、公司和机构纷纷转而选择这个性价比超高的模型。这也使得OpenAI的萨姆·奥特曼深感忧虑,甚至放出要与DeepSeek合作的风声。

由此可见,DeepSeek的中国式创新,对OpenAI、英伟达、Meta、微软、甲骨文等整个西方科技界都产生了巨大的冲击,不愧是来自中国的神秘力量。

开年之际,梁文峰受邀参加总理座谈会

在开年的重要时刻,梁文锋受邀参加总理座谈会,其发言内容发人深省,结合他以往的采访,观点凝练为以下四大要点,值得我们点赞、收藏并持续关注。

01.

开源:构建发展根基的关键路径

在颠覆性科技创新的浪潮下,技术壁垒脆弱不堪,闭关锁国更是不合时宜。以OpenAI为例,即便不开源,被超越也是大势所趋。那么,如何构建自身的核心竞争力?关键在于将价值沉淀于团队成员,助力他们持续成长,积累认知,形成创新活力充沛的组织与文化。真正的优势并非单纯拉开距离,而是自身不断向前奔跑,在竞争中脱颖而出。

02.

从跟随到引领:中国科技创新的角色转变

过往,中国不少企业习惯等待他人的科技创新成果,奉行跟随模仿策略,处于从1到100的阶段,缺乏从0到1的创新突破。梁文锋指出,中国未来应在科技创新领域担当贡献者,而非一味跟随、坐等搭便车。

从0到1的创新难点并非资金不足,而是信心缺失以及创新组织文化难以凝聚高端人才。Dipsy e探索出先进管理机制,内部打破层级与部门隔阂,成员有创新想法时,算力和人员智力调动不受限且无需审批,前提是相关人员对项目感兴趣。这一概念不仅适用于企业管理,更对社会制度适配创新需求有重要启示。

03.

顶尖人才的吸引力:挑战与目标

对于顶尖人才而言,相较于数百万年薪,攻克世界最具挑战性难题、追求宏伟目标更具吸引力。当前,社会提供硬核科技创新的机会较少,导致大量聪明人才未被充分挖掘。Deep sick致力于攻克高难度技术,因而吸引了众多优秀人才。

04.

时代变迁与观念转变:知识与创新的力量

梁文锋回忆,80年代他出生于五线城市,正值改革开放初期,广东赚钱机会多,即便学历不高也能获利,“读书无用论”盛行。但如今再回广东,赚钱不易,观念也发生了深刻变化。若未来社会能让致力于硬核创新的人取得成功,必然会激发大众对硬核科技创新的热情,推动其蓬勃发展。

梁文锋的观点为我们在科技创新与社会发展的道路上指明了方向,无论是企业还是社会,都应从中汲取智慧,积极拥抱变革,为实现创新驱动发展而努力。

Deepseek那么厉害为啥要开源让国外得利?看看DeepSeek V3怎么说?

第一、为了推动 AI 技术的普及和发展:DeepSeek 想着通过把模型开源,把 AI 技术的使用门槛给降低,让更多的研究人员、开发者还有组织能够去访问和使用那些高性能的 AI 模型,这样就能推动整个 AI 社区往前进步啦。

第二、关于成本效益这方面:DeepSeek V3 训练起来成本特别低,就只是其他顶级模型的几分之一而已。这就让中小企业还有学术机构也能承担得起高性能 AI 模型的训练和使用费用了,也促进了 AI 技术被广泛地应用。

第四、在技术创新与共享这块:DeepSeek 一直专注搞技术创新,通过把模型开源,研究人员和开发者就能自由自在地使用、修改和优化模型,能进一步推动 AI 技术向前发展。

第五、从全球化视野来看:DeepSeek 希望借着开源模型,展示出中国 AI 技术的能耐,让中国在全球 AI 领域的影响力变大,推动国际间的技术交流与合作。

第六、社区驱动的创新这方面:开源模式能帮助形成那种社区驱动的开发环境,开发者能够一起贡献代码、分享经验,让技术的迭代和创新速度加快。

第七、关于伦理与公平性这方面:通过开源这种方式,DeepSeek 能保证所有的用户都可以平等地去访问和使用 AI 技术,这样就避免了出现技术被垄断以及不公平的情况。

第八、在教育与培训这块:开源模型给教育和培训带来了好多丰富的资源。它能帮新手很快地熟悉操作,让整体的技术水平都能有所提高。

DeepSeek 的开源策略可不简单,它不光能让技术发展得又快又广,而且还能把使用的门槛降低,推动全球范围内的 AI 创新和合作。虽然有些国外的模型选择闭源,可 DeepSeek 这种开放的态度给全球的 AI 社区带来了新的机会和难题。

按照DeepSeek 给我们的答案,深度求索(DeepSeek)公司选择开源其人工智能模型,可能是基于多方面的考虑。

开源可以促进技术的透明度和可信度,让更多的开发者和研究者能够审查、学习和改进模型,从而推动整个领域的发展。此外,开源也有助于构建一个更加活跃的社区,通过集体智慧来解决复杂问题,并加速创新。

虽然国外一些模型选择闭源,但这并不妨碍开源模型在全球范围内的应用和受益。开源并不意味着失去控制或利益,相反,它可以通过建立标准、吸引合作伙伴和用户,以及通过提供服务和支持来创造商业价值。深度求索可能认为,通过开源,可以更好地展示其技术实力,吸引人才,以及与全球的研究机构和企业建立合作关系,从而实现更广泛的影响和更长远的利益。

发布于:广东省

Powered by 国际站手机版 @2013-2022 RSS地图 HTML地图