杨兆波 郭帆 在数字化时代的浪潮中,中国已经崭露头角,成为这一领域的领跑者。华为,作为中国的科技巨头,其在2020年发布的全球首个5G智能核心网解决方案,不仅标志着中国在通信技术上的重大突破,更象征着中国从2G到5G的跨越式发展。这一成就仅用了22年的时间,相较于世界从1G到4G所花费的40年,中国在这期间实现了从跟跑者到领跑者的华丽转身。而华为的5G领跑,并非仅仅依赖于运气,更多的是中国科技实力和智慧的体现。 然而,就在人们以为华为已经将中国在数字化时代的优势发挥到极致时,DeepSeek的横空出世,再次刷新了人们对中国的科技实力的认知。DeepSeek,由幻方量化于2023年4月创立,其140名成员全部是我国大学培养出来的佼佼者。这支年轻的团队,在成立后迅速崭露头角,发布了一系列大模型,包括DeepSeek-LLM通用大语言模型、DeepSeek-Coder代码大语言模型等,展现了强大的研发实力和创新能力。 而2025年1月27日,DeepSeek发布的最新人工智能模型DeepSeek-V3,更是对全球AI企业产生了深远的影响。这一模型不仅代表了DeepSeek的技术巅峰,更可能重新洗牌世界AI企业格局。 一、DeepSeek研发团队:中国本土培养的年轻俊彦 DeepSeek的成功,离不开其独特的研发团队。这支团队完全由本土人才组成,他们大多毕业于清华大学、北京大学、中山大学和北京邮电大学等顶尖高校。团队成员中,没有“海归”,全部都是中国本土培养出的年轻俊彦。他们大多出生于1998年左右,工作经验不超过五年,但却拥有聪明才智和理工科背景,充满活力和创新精神。 DeepSeek的创始人梁文峰,是浙江大学信息与电子工程学系的本科和硕士学位获得者。他现任杭州幻方科技有限公司董事长兼CEO,对DeepSeek的发展起到了至关重要的引领作用。团队中的其他成员也都是各个领域的佼佼者,他们在DeepSeek的大模型领域取得了显著成就。 在技术创新方面,DeepSeek团队通过不断研发和优化,成功降低了模型的计算成本。例如,DeepSeek-V3仅使用2048块CPU完成了6710亿次参数模拟的训练,总成本仅为557万美元,远低于西方同类型软件的开发费用。此外,团队还非常注重软硬件协同,成员在优化硬件和3D生成等方面也做出了重要贡献。 二、DeepSeek-V3的特点:处于领先水平 DeepSeek-V3是一款基于Mixture-of-Experts(MoE)架构的大型语言模型,具有多项领先的技术特点。 首先,在计算能力方面,DeepSeek-V3通过动态激活相关“专家”,在保持高性能的同时,大幅度降低了计算成本。这种设计使得模型能够在资源有限的情况下仍能表现出色,为大规模应用提供了可能。 其次,在技术性能方面,DeepSeek-V3展现了出色的多模态AI能力。在三维空间推理方面,其准确率高达87.6%;在跨模态意图理解方面,其F1值达到了91.2%。此外,在多个基准测试中,DeepSeek-V3也表现出色,例如在MMLU-Pro测试中以75.9%的准确率领先。 再者,在性价比方面,DeepSeek-V3同样具有显著优势。其训练成本仅为550万美元,相比之下,GPT-4的训练成本超过1亿美元。这种高性价比使得DeepSeek-V3在超大规模语言模型领域中具有显著的优势,让更多企业和研究机构能够接触和使用到先进的语言模型技术。 此外,DeepSeek-V3还选择了开源策略,允许外部修改和定制。这种策略不仅吸引了更多的开发者进行创新,也为全球中小企业提供了优质的AI技术支持。DeepSeek-V3的可扩展性也非常出色,能够轻松地进行规模扩展和适应新的需求和挑战。 三、已经下载DeepSeek的世界各大软件公司及中国AI头部企业 自DeepSeek-R1模型发布以来,其性能和实用性受到了广泛认可。微软、亚马逊、英伟达等国际科技巨头纷纷选择与DeepSeek合作,将其模型集成到各自的平台中。同时,国内10家AI头部企业也纷纷下载了DeepSeek的模型,与其展开深度合作。 这些企业的合作方式多样,包括投资、提供算力基础设施、数据支持和技术合作等。这些合作不仅推动了DeepSeek的发展,也为中国AI企业在技术、数据和算力等方面带来了显著的提升和效益。同时,这些合作也将极大推动AI技术在中国众多大中小企业的推广使用,促进中国AI产业的快速发展。 四、DeepSeek对全球AI格局及各方面影响 DeepSeek的出现,无疑对全球AI产业格局产生了深远的影响。 首先,在技术逻辑方面,DeepSeek的技术突破打破了传统的“算力即王道”的逻辑。通过算法创新,DeepSeek显著降低了对高性能芯片的依赖,这使得全球AI产业的竞争焦点发生了转移。英伟达等传统芯片巨头的市场地位受到了挑战,而更多地关注于软件和算法创新的公司在新的竞争格局中崭露头角。 其次,在金融市场方面,DeepSeek的影响也是显而易见的。随着DeepSeek技术的崛起和市场认可度的提高,相关AI企业的估值也发生了变化。半导体巨头如Nvidia和Broadcom的股价均出现了下滑,市值损失近6000亿美元。这反映了市场对AI产业格局变化的敏感性和预期。 此外,DeepSeek的崛起还将推动全球AI技术的创新和应用。其开源策略和高性价比使得更多的企业和研究机构能够接触和使用到先进的语言模型技术。这将促进AI技术在各个领域的应用和创新,推动全球AI产业的快速发展。 同时,DeepSeek的成功也将对中国AI产业的发展产生积极的影响。DeepSeek的团队完全由本土人才组成,他们的成功将激励更多的中国年轻人投身于AI领域的研究和创新。同时,DeepSeek与国内众多AI头部企业的合作也将推动中国AI产业的协同发展和技术提升。 五、展望未来,DeepSeek与中国AI产业的共舞 展望未来,DeepSeek有望在全球AI产业中占据重要地位,其技术突破和商业模式将对行业发展产生深远影响。中国AI产业将在DeepSeek等创新企业的引领下,实现快速崛起和跨越式发展。 中国拥有庞大的数据资源和丰富的人才储备,这为AI产业的发展提供了得天独厚的优势。DeepSeek的成功将吸引更多的资源和人才投入到AI领域,进一步推动中国AI产业的创新和发展。 同时,中国政府对AI产业的高度重视和支持,也为DeepSeek等中国AI企业的发展提供了良好的环境。随着政策的逐步落地和市场的不断扩大,中国AI产业将迎来更加广阔的发展空间。 在华为5G领跑全球之后,DeepSeek有望在AI领域再次书写中国的传奇。让我们共同期待DeepSeek与中国AI产业共同创造的美好未来! 作者简介 杨兆波,智库主任学者。 郭帆,著名作家、诗人、书法家、学者。 |