解码DeepSeek及人工智能的未来

作者：

陈劲、安健著

定价：79.00元

ISBN：978-7-5217-7495-5

出版时间：2025.5

作者简介

陈劲

清华大学经济管理学院创新创业与战略系教授、技术创新研究中心主任，中国管理科学学会副会长，整合式创新、有意义的创新以及“基于核心能力的企业创新生态系统”理论的提出者，全国创新争先奖获得者，2021年、2023年入选“全球最具影响力的50位管理思想家”。

安健

君彧咨询创始人、阿里巴巴前高级营销专家、《哈佛商业评论》内容总监。

内容简介

深度解读DeepSeek的经济与社会意义

阐述人工智能DeepSeek的技术逻辑

助力企业人工智能的发展和商业化变革

本书深入剖析了中国人工智能崛起的神秘力量——DeepSeek，全面解读了其背后的技术逻辑、商业模式以及对未来社会的深远影响。通过对开源与闭源之争的探讨，以及对中美人工智能领域领袖人物不同战略思考的剖析，作者揭示了人工智能技术背后的复杂性，勾勒出技术进化的脉络，并勾画出产业未来发展的路径。书中还特别关注了中国在成本结构等方面的独特优势，展现了中国在全球人工智能竞争中的地位与潜力。本书会深入浅出地介绍人工智能DeepSeek的技术逻辑，技术上如何控制成本，商业化的底层逻辑，对于中国人工智能的发展和商业化都有很好的指导意义。

无论是科技爱好者、行业从业者，还是对未来充满好奇的普通读者，本书都将提供深刻的见解与启发，帮助读者更好地理解人工智能的当下与未来。

专家推荐

徐扬生香港中文大学(深圳)校长、中国工程院院士

《深度探索》描述了人工智能浪潮为何会在中国这个有数千年文明传统的国度出现的，它的背后的原动力是什么，它正在走向何方，如何用世界的眼光看中国的创新科技，又如何用中国精神去引领世界潮流的。此书值得关心人工智能和中国创新科技的工程师、企业家、教师和投资者阅读参考。

吴飞浙江大学计算机科学与技术学院教授

DeepSeek使得人工智能像水、电以及网络一样触手可及，为实现“时时、处处、人人可用人工智能”带来曙光。未来，DeepSeek不同大小模型将被部署为不同场景中的人工智能基座，牵引人工智能软硬件技术生态健康发展，引领全社会迈向普遍智能之路。本书的出版将使得读者更了解DeepSeek，从而使用 DeepSeek、创新DeepSeek。

编辑推荐

揭秘Deepseek的成功密码

Deepseek的横空出世，打破了传统科技巨头的垄断，成为全球瞩目的焦点。本书通过深入剖析Deepseek的成功案例，揭示了其背后的技术、战略和市场机遇，揭示了Deepseek如何在多国政府的封杀下，依然成为下载量第一的AI应用。

2. 深入理解大模型的威力与挑战

大模型（如GPT系列）是当今AI技术的核心驱动力。本书详细探讨了大模型的构建与应用，解释了大数据、大参数、大算力如何共同推动AI的进步。

同时，书中也揭示了大模型的“幻觉”问题，即AI在生成内容时可能出现的错误和偏差。这些内容将帮助读者更全面地理解大模型的潜力与局限。

3. 开源与闭源：AI商业模式的未来之争

开源与闭源是AI领域的两大商业模式。本书通过回顾微软与开源的历史，探讨了在AI发展初期，企业应选择哪种商业模式。作者还进一步探讨了为什么OpenAI最初选择成为一家非盈利公司，以及这种选择对其后续发展的影响。

序言勇立潮头的恒定价值

第一章为什么偏偏是中国，偏偏是DeepSeek？

横空出世的DeepSeek

颠覆认知：从华尔街到AI大佬

技术民主化的胜利？

面对抄袭的指责：什么是蒸馏？

盗火者：辛顿、奥尔特曼、梁文锋

第二章大模型——站在巨人肩膀之上

苦涩的教训

联结主义—另一条道路

辛顿和深度神经网络

突破算力和数据之墙

GPU对决CPU

深度神经网络初露峥嵘

自注意力机制点燃大模型时代

惊艳：大模型的开窍时刻

大模型的中国涌现

第三章淬火的刀：DeepSeek创新启示录

回溯：DeepSeek的来时路

MoE模型：各操一剑的顶级大师

MLA：DeepSeek的信息过滤员

妙招：多令牌预测

以柔克刚：用算法压榨算力

“价格屠夫”？AI不是富豪的玩具

重构研发的三个常识：稀疏，无约束，多令牌

第四章强化学习、大模型与归来少年

千呼万唤不出来—Scaling Law的边际时刻

成也Scaling Law，败也Scaling Law

不走寻常路：绕过监督微调

王者归来：强化学习再登场

再谈蒸馏：知识迁移的力量

DeepSeek：探索未知的少年

第五章算力狂潮：从崇拜到跌落神坛

什么是算力

“卖铲子”的英伟达

OpenAI与DeepSeek：两种路线的较量

中国算力评估

第六章开源与闭源：商业模式之争

开源才是人类文明的常态

闭源的由来与微软

OpenAI和马斯克的开源之争

DeepSeek：开源战胜闭源

开源与闭源：AI商业模式的两难选择

第七章豪赌未来：DeepSeek及其竞争对手

美国科技巨头重金押注

各路英豪：中国AI的差异化竞争

颠覆式创新三要素

第八章驯服AI幻觉：从苏格拉底提问到多维思维

幻觉：大模型的致命之处

一道破万法：使用AI将知识引导出来

高效使用AI的核心能力：学会提问

避免AI幻觉的另一个思路：联网更新与交叉验证

多元融合思维：拓展维度、精简维度与维度转换

第九章未来己来：AI趋势的多维透视

量子人工智能：算力跃迁的终极战场

生成式AI的三重进化

行业渗透的深水区挑战

具身智能：物理世界的AI觉醒

人机共生：后AI时代的能力重塑

第十章大模型：从“诸神之战”到负责任的创新

从DeepSeek到 deep innovation

创新者精神超越企业家精神

创新者精神：王选的故事

呼唤负责任创新

第十一章唯有深度创新能力不可替代

熊彼特权重

会聚创新：一个灰烬中重生的案例

深度创新能力是人类最后的坚持

第十二章 AI：是普罗米修斯的火种还是潘多拉的魔盒？

速度与火焰终结一切

比尔·盖茨的机器人税

歌德的寓言，维纳的担忧

重温工具理性与价值理性

参考文献

精彩书摘

2025年1月27日，正值中国农历新年除夕的前一天，当中国人正忙着采买年货、打扫庭院，准备热热闹闹地迎接新年时，一家来自中国的人工智能初创公司深度求索（ DeepSeek ）却在大洋彼岸的美国搅动风云。

当天美股一开盘，全球领先的图形处理器和人工智能芯片制造商英伟达（Nvidia）的股价就剧烈波动。当日收盘，英伟达的股价暴跌17%，市值蒸发了近6000亿美元，这是自2020年3月新冠疫情初期以来英伟达最糟糕的单日表现。[i]

除了英伟达，其他与AI相关的股票均出现不同程度的下挫，博通（Broadcom）股价下跌17%，台积电（TSMC）下跌13.33%，美光（Micron）股价下跌11.71%，AMD下跌6%，微软下跌2%。

英伟达领跑的暴跌也导致纳斯达克综合指数（Nasdaq）跌3.07%[ii]，标普500（S&P 500）指数跌1.46%[iii]。人工智能领域的衍生品，如电力供应商也受到重创。美国联合能源公司股价下跌21%，Vistra的股价下跌29%。

此次暴跌的主要原因是市场对DeepSeek的竞争威胁的担忧。DeepSeek在1月27日宣布其开源AI模型R1的训练成本仅为550万美元，远低于英伟达客户为运行类似AI模型（如ChatGPT）所支付的数十亿美元。这一消息引发了市场对AI芯片需求可能放缓的担忧，导致投资者对英伟达的未来收入预期产生怀疑。

此外，DeepSeek的技术突破被认为可能会改变AI行业的经济格局，降低对英伟达高端GPU的需求，甚至可能导致芯片价格暴跌。尽管英伟达的发言人对DeepSeek的技术进步表示认可，但市场仍对其长期影响感到不安。

同一天，一款来自中国的神秘应用赫然出现在App store的榜首，它拿下了包括美国在内的51个国家及地区的应用商店免费榜第一。没错，这款应用还是DeepSeek。一时间，DeepSeek在各大应用商店的屠版开始霸榜各大媒体头条，也引发了从华尔街到硅谷的恐慌，。

来源：各相应媒体网站主页截图

图 1.1 DeepSeek霸榜各大美媒头条

表面上看，DeepSeek一夜之间爆火，火得一塌糊涂，火得一发不可收拾，但又火得莫名其妙。不过太阳底下没有新鲜事，DeepSeek的横空出世背后其实是中国AI公司在这一领域持续多年的深耕细作。DeepSeek的崛起是一个典型的中国科技初创公司凭借技术创新和开源模式迅速崭露头角的故事。

2024年12月末，有媒体报道称，小米总裁雷军以年薪千万的优厚条件聘请了一位被称为“天才AI少女”的年轻人才，负责领导小米的人工智能大模型团队。这位出生于1995后的女性名叫罗福莉，过去两年间曾效力于DeepSeek团队，并深度参与了大模型研发的核心工作。

对于不关注科技圈的普罗大众，这其实是DeepSeek第一次走进公众视野，不过，当时天才少女的风头显然盖过了DeepSeek，这越发使得后者在一夜成名后显得低调而神秘。从零散的、关于创始人梁文锋的背景资料中， 2015年12月1日水木社区上转发的一则招聘启事，勾画出梁文锋量化交易之路的轮廓：

2008年，L先生带着8万元本金，开始了自己独立的量化交易之路。2015年，经历过7年熊市牛市大轮回的L先生，以每年超过100%的复合收益率迈入了亿元富豪的队伍。

这个行业里最先富起来的L先生认为，中国的量化交易将从“单兵游侠”的时代转向极客汇聚的私募基金时代。他和IT圈的朋友创办了自己的公司，希望能打造一支世界一流的量化私募团队。他们给自己的公司取名“幻方科技”。“幻方”取自于中国古代洛书《九宫图》，是一种特殊的矩阵，是科学的结晶与吉祥的象征。

L先生的理想是有朝一日能够与世界级的量化交易泰斗——西蒙斯的文艺复兴公司相媲美。

这则校园招聘的标题是“顶尖量化对冲基金公司觅牛人”。十年前，梁文锋是否能够招到“牛人”不太好说。但随着DeepSeek-V3的问世，业界普遍推测这一成就背后必有行业资深专家或“大牛”领衔。然而，罗福莉的走红却揭示了一个出人意料的事实：引领DeepSeek技术革新的主要推手并非传统意义上的行业老将，而是一群像她这样充满活力和创新精神的年轻才俊。

尽管公司成员年轻，DeepSeek在人工智能领域却堪称老兵。正如这条招聘简历所透露的，其起点可以追溯至2008年，当时梁文锋从浙江大学信息与电子工程学本科及硕士毕业，投身量化投资领域。他与友人共同探索利用数学模型和计算机程序进行交易的可能性，这段经历让他深刻体会到技术驱动创新的重要性。

2015年，梁文锋与校友徐进联合创立了“幻方量化”。徐进拥有浙江大学信号与信息处理博士学位，曾在华为技术有限公司上海研究所任职。他们购置了大量GPU，建立了实验室，开始研究如何借助AI技术构建投资策略。这一举措使幻方量化在短短四年内成长为管理资金规模超百亿的私募巨头。既然AI制定的量化策略能跑赢市场，那AI是否会产生真正的智能？大胆猜测，这第一桶金可能在梁文锋心中种下了实现通用人工智能的种子。

随着业务的扩展，幻方量化于2019年成立了专门的AI实验室，并投入逾10亿元资金，研发了AI超级计算机“萤火一号”和“萤火二号”。其中，“萤火二号”配备了约1万张英伟达A100显卡，其算力相当于超过72万台个人电脑。这些强大的计算资源助力幻方量化在2021年将资产管理规模提升至1000亿元人民币。

到了2022年底，ChatGPT的问世终于引燃了梁文锋对通用人工智能（AGI）的热情。多年的积累让他做好了迎接这一挑战的准备。“我们成立了名为深度求索的新公司，从语言大模型入手，未来还将涉及视觉等领域。”梁文锋表示，尽管OpenAI公布了论文和代码后，国内外涌现了许多大模型公司，但他坚信在未来20年内，无论是大企业还是初创公司都将拥有广阔的发展空间。

与其他国产大模型不同，DeepSeek选择了开源道路，并且在第三代大模型发布时仍未推出任何具体应用，也未全面考虑商业化。梁文锋明确表示，他们的目标不在于开发单一应用，而是专注于基础研究和前沿创新。这种纯粹的理想主义，和不被任何资方束缚裹挟的底气，在某种程度上来自于梁文锋早已实现财务自由的洒脱。这一点，和马斯克收购特斯拉大举压注新能源车，有异曲同工之妙。真正的耐心资本只能是自己的资本。

长期以来，人们普遍认为欧美科技界在从零到一的技术创新上更具优势，而中国企业则擅长在应用层面发力，即所谓的“从1到N”。然而，梁文锋并不认同这种观点，他坚信中国AI不仅会跟随，还能以创新者的身份参与到新的技术浪潮中。

2023年7月17日，梁文锋成立了名为杭州深度求索人工智能基础技术研究有限公司，宣布其目标是打造“真正具备人类级别智慧的人工智能”。当时，有一种观点在网络上流传：在中国，拥有高性能GPU最多的机构并非人工智能公司，而是一家量化私募。据《财经十一人》报道，截至2023年，中国拥有超过1万张GPU的企业不超过5家，幻方量化是其中唯一一家非科技“大厂”的企业。[iv]这种一掷千金的果断与勇气，绝非一般企业管理者能企及；这种不合传统商业逻辑的决策，只能来自于一个对通用人工智能有坚定信仰的创始人。

推荐人：北师香港浸会大学姜羽尧

深圳之窗 微信公众号一大波便民功能上线啦！扫面下方二维码，关注后在微信对话框中回复“ 摇号 ” 即可实时获取申请最新结果；回复“ 电费 ” 即可在线查询用电信息以及缴费！

qrcode_for_gh_04f6adc5f733_430

分享到

解码DeepSeek及人工智能的未来

微信扫一扫：分享

相关推荐

解码DeepSeek及人工智能的未来

李晓敏荐书︱《经营方略（全新修订版）》：一本企业经营管理的宝典

夏云平教授荐书 |《巴赫传：时代、观念与书籍》

袁文荐书 |《城市更新项目全周期业财税管理指南》

李晓敏荐书︱《杭州模式：DeepSeek与中国算谷》

李晓敏荐书︱对货币与政府宏大而深刻的阐述