刚刚,梁文锋被曝史上首次融资!DeepSeek V4彻底摆脱英伟达,不低于100亿美元的估值

张开发
2026/4/22 10:22:29 15 分钟阅读
刚刚,梁文锋被曝史上首次融资!DeepSeek V4彻底摆脱英伟达,不低于100亿美元的估值
刚刚梁文锋被曝史上首次融资DeepSeek V4彻底摆脱英伟达来源新智元【导读】今早AI圈炸了从不融资的DeepSeek首度开口寻求100亿美元估值筹集3亿美元。V4即将来袭万亿参数华为昇腾加持连老黄都慌了今早AI圈都被这个消息震撼了。外媒The Information曝出DeepSeek正寻求首次外部融资打破「从不融资」铁律的DeepSeek这次寻求以不低于100亿美元的估值筹集至少3亿美元的资金。在极其烧钱的AI大模型开发竞赛中DeepSeek也需要充实资金弹药库了。曾经的DeepSeek坚决不融资对冲基金巨头幻方量化旗下的DeepSeek在R1引起硅谷和华尔街轩然大波后多次拒绝了国内顶级风投和科技巨头的投资意向。DeepSeek这次选择启动融资意味着梁文锋终于做出了巨大的转变。此前作为技术理想主义者的他一直希望保持DeepSeek的独立性不受商业压力的干扰。上一次发布新一代模型还是在2025年DeepSeek R1爆火时。如今DeepSeek已经让全行业等了一年半。如果此次融资成功DeepSeek就可以拥有更多算力同时还能开出更高薪酬防止顶尖研究者流失。不过由于DeepSeek「中国初创公司」的身份一些美国风险投资人态度会比较谨慎。DeepSeek V4的发布时间一再推迟同时AI圈的竞争环境已经大变样。如今全球的各大顶尖模型都在快速迭代中美两国的科技巨头们正凭借财大气粗的优势不断占领高位。或许这种压力终于促使DeepSeek转变了融资策略。V4一场万亿参数的硬仗按照The Information的说法V4原定今年2月亮相但已跳票多次。路透在4月初给出的最新时间窗口是「未来几周内」。从目前已知信息来看V4的规模和野心远超前代。参数量跃升至万亿级别。V4采用MoE架构总参数约1万亿但每个token仅激活约370亿参数推理成本与V3持平。这个设计思路延续了DeepSeek一贯的效率优先哲学。来源网络的爆料图上下文窗口扩展到100万token。V4引入了一套名为Engram的条件记忆架构实现了对超长上下文的恒定时间检索。据内部测试在100万token长度下的信息召回率达到97%远超V3在128K上下文时的表现。原生多模态。据FT报道V4将是DeepSeek首个原生多模态模型支持文本、图像和视频生成。此前DeepSeek的模型一直以纯文本为主而其他旗舰模型早已拥抱多模态。代码能力大幅强化。V4从立项之初就以代码生成为核心目标。内部benchmark显示SWE-bench成绩超过80%HumanEval达到90%。据称V4能处理整个代码仓库级别的复杂bug修复在长上下文代码推理上的表现将超越Claude和GPT系列。此外还有爆料称V4预计将分两个版本发布。完整版超万亿参数针对高级推理和复杂代码任务优化面向华为昇腾芯片轻量版约2000亿参数面向通用对话和API服务可在其他国产芯片上运行。开源方面V4计划以Apache 2.0协议开放权重延续DeepSeek一贯的开源策略。什么时候能用上多个信源指向4月底。3月9日一个名为「V4 Lite」的版本曾短暂出现在DeepSeek平台上随后被撤下。4月初又有开发者发现API节点上出现了V4 Lite的测试版本推理速度提升30%128K上下文的信息召回率从45%跳到了94%。DeepSeek近日还在内蒙古乌兰察布发布了服务器运维工程师和交付经理的招聘岗位这是该公司首次公开招聘算力基础设施相关的驻场人员。种种迹象表明V4已经不在实验室里了而是在为大规模部署做最后准备。老黄最不想看到的事正在发生V4延期的核心原因跟模型本身关系不大。真正的难点是一场底层硬件的大迁移。DeepSeek之前所有模型都基于英伟达芯片训练。但V4走了一条不同的路。据路透报道V4将运行在华为最新的昇腾芯片上。DeepSeek的工程师们花了大量时间解决V4对华为芯片的适配问题重写核心代码从英伟达的CUDA生态迁移到华为的CANN架构。这是一个技术决策也是一个战略信号。DeepSeek刻意没有给英伟达和AMD提前提供V4做优化适配而是将早期访问权限独家给了国产芯片厂商。如果V4在华为芯片上跑出有竞争力的性能它将是全球第一个不依赖英伟达的前沿AI模型。老黄本人对此也不淡定。他在近期采访中直言DeepSeek基于华为平台的新模型「对美国来说将是一个糟糕的结果」。言下之意是一旦AI模型被优化为在中国硬件上跑得最好美国芯片的护城河就不再牢固。3亿美元脱离英伟达生态如今即便是以「花小钱办大事」著称的DeepSeek也无法仅靠一家持续输血。据斯坦福大学2026年度AI指数报告截至今年3月美国顶级模型与中国最强竞品之间的性能差距仅剩2.7个百分点。差距越小每一步追赶的边际成本越高。就在本月OpenAI刚以3000亿美元估值完成400亿美元融资相比之下3亿美元也算不得天文数字。V4真正的赌注在于它要证明前沿AI可以完全脱离英伟达生态独立运转。3亿美元押的就是这一把。参考资料https://www.theinformation.com/articles/chinas-deepseek-raising-money-first-time-10-billion-plus-valuation?rcepv9gi

更多文章