刚刚，梁文锋被曝史上首次融资！DeepSeek V4彻底摆脱英伟达,不低于100亿美元的估值

张开发

• 2026/4/22 10:22:29 • 15 分钟阅读

分享文章

刚刚，梁文锋被曝史上首次融资！DeepSeek V4彻底摆脱英伟达,不低于100亿美元的估值

刚刚梁文锋被曝史上首次融资DeepSeek V4彻底摆脱英伟达来源新智元【导读】今早AI圈炸了从不融资的DeepSeek首度开口寻求100亿美元估值筹集3亿美元。V4即将来袭万亿参数华为昇腾加持连老黄都慌了今早AI圈都被这个消息震撼了。外媒The Information曝出DeepSeek正寻求首次外部融资打破「从不融资」铁律的DeepSeek这次寻求以不低于100亿美元的估值筹集至少3亿美元的资金。在极其烧钱的AI大模型开发竞赛中DeepSeek也需要充实资金弹药库了。曾经的DeepSeek坚决不融资对冲基金巨头幻方量化旗下的DeepSeek在R1引起硅谷和华尔街轩然大波后多次拒绝了国内顶级风投和科技巨头的投资意向。DeepSeek这次选择启动融资意味着梁文锋终于做出了巨大的转变。此前作为技术理想主义者的他一直希望保持DeepSeek的独立性不受商业压力的干扰。上一次发布新一代模型还是在2025年DeepSeek R1爆火时。如今DeepSeek已经让全行业等了一年半。如果此次融资成功DeepSeek就可以拥有更多算力同时还能开出更高薪酬防止顶尖研究者流失。不过由于DeepSeek「中国初创公司」的身份一些美国风险投资人态度会比较谨慎。DeepSeek V4的发布时间一再推迟同时AI圈的竞争环境已经大变样。如今全球的各大顶尖模型都在快速迭代中美两国的科技巨头们正凭借财大气粗的优势不断占领高位。或许这种压力终于促使DeepSeek转变了融资策略。V4一场万亿参数的硬仗按照The Information的说法V4原定今年2月亮相但已跳票多次。路透在4月初给出的最新时间窗口是「未来几周内」。从目前已知信息来看V4的规模和野心远超前代。参数量跃升至万亿级别。V4采用MoE架构总参数约1万亿但每个token仅激活约370亿参数推理成本与V3持平。这个设计思路延续了DeepSeek一贯的效率优先哲学。来源网络的爆料图上下文窗口扩展到100万token。V4引入了一套名为Engram的条件记忆架构实现了对超长上下文的恒定时间检索。据内部测试在100万token长度下的信息召回率达到97%远超V3在128K上下文时的表现。原生多模态。据FT报道V4将是DeepSeek首个原生多模态模型支持文本、图像和视频生成。此前DeepSeek的模型一直以纯文本为主而其他旗舰模型早已拥抱多模态。代码能力大幅强化。V4从立项之初就以代码生成为核心目标。内部benchmark显示SWE-bench成绩超过80%HumanEval达到90%。据称V4能处理整个代码仓库级别的复杂bug修复在长上下文代码推理上的表现将超越Claude和GPT系列。此外还有爆料称V4预计将分两个版本发布。完整版超万亿参数针对高级推理和复杂代码任务优化面向华为昇腾芯片轻量版约2000亿参数面向通用对话和API服务可在其他国产芯片上运行。开源方面V4计划以Apache 2.0协议开放权重延续DeepSeek一贯的开源策略。什么时候能用上多个信源指向4月底。3月9日一个名为「V4 Lite」的版本曾短暂出现在DeepSeek平台上随后被撤下。4月初又有开发者发现API节点上出现了V4 Lite的测试版本推理速度提升30%128K上下文的信息召回率从45%跳到了94%。DeepSeek近日还在内蒙古乌兰察布发布了服务器运维工程师和交付经理的招聘岗位这是该公司首次公开招聘算力基础设施相关的驻场人员。种种迹象表明V4已经不在实验室里了而是在为大规模部署做最后准备。老黄最不想看到的事正在发生V4延期的核心原因跟模型本身关系不大。真正的难点是一场底层硬件的大迁移。DeepSeek之前所有模型都基于英伟达芯片训练。但V4走了一条不同的路。据路透报道V4将运行在华为最新的昇腾芯片上。DeepSeek的工程师们花了大量时间解决V4对华为芯片的适配问题重写核心代码从英伟达的CUDA生态迁移到华为的CANN架构。这是一个技术决策也是一个战略信号。DeepSeek刻意没有给英伟达和AMD提前提供V4做优化适配而是将早期访问权限独家给了国产芯片厂商。如果V4在华为芯片上跑出有竞争力的性能它将是全球第一个不依赖英伟达的前沿AI模型。老黄本人对此也不淡定。他在近期采访中直言DeepSeek基于华为平台的新模型「对美国来说将是一个糟糕的结果」。言下之意是一旦AI模型被优化为在中国硬件上跑得最好美国芯片的护城河就不再牢固。3亿美元脱离英伟达生态如今即便是以「花小钱办大事」著称的DeepSeek也无法仅靠一家持续输血。据斯坦福大学2026年度AI指数报告截至今年3月美国顶级模型与中国最强竞品之间的性能差距仅剩2.7个百分点。差距越小每一步追赶的边际成本越高。就在本月OpenAI刚以3000亿美元估值完成400亿美元融资相比之下3亿美元也算不得天文数字。V4真正的赌注在于它要证明前沿AI可以完全脱离英伟达生态独立运转。3亿美元押的就是这一把。参考资料https://www.theinformation.com/articles/chinas-deepseek-raising-money-first-time-10-billion-plus-valuation?rcepv9gi

刚刚，梁文锋被曝史上首次融资！DeepSeek V4彻底摆脱英伟达,不低于100亿美元的估值

最新文章

基于深度徐恶习的YOLOv8和YOLOv11的汽车Logo识别汽车品牌视频实时检测项目

中兴光猫管理神器zteOnu：一键开启工厂模式与永久Telnet

p90RSK重组兔单抗能否解析激酶信号的多维调控？

p90RSK兔多克隆抗体能否覆盖激酶信号的全谱检测？

[工业互联-16] 从通用到确定：实时Linux内核补丁PREEMPT-RT的演进与工业实践

从零手搓一个DES-CBC加密库：用C语言一步步还原经典算法（附完整源码）

推荐文章

工业通信协议：Modbus与OPC UA的解析与实现

Verilog仿真翻车现场：Testbench里这些‘坑’你踩过几个？（含$monitor、defparam避坑指南）

Python自动化新手福音：用uiautomator2+Weditor搞定安卓APP元素定位（保姆级避坑）

Path of Building完全指南：5步掌握流放之路最强Build规划工具

保姆级避坑指南：在Ubuntu 16.04上搞定Kinect v2驱动与ORB-SLAM2环境搭建

Java CompletableFuture 并发链式任务管理

相关文章

分享文章

更多文章

终极指南：如何用Zotero-GPT插件让AI帮你处理海量文献

WarcraftHelper：让经典魔兽争霸3在现代电脑上焕发新生的必备工具

推推我自己研发的-厂内订餐小程序

Ollama模型推理日志：daily_stock_analysis镜像中Token消耗、延迟、错误率监控

万字长文：单Agent架构的极限与突破，何时需要Multi-Agent？

如何在5分钟内免费创建专业EPUB电子书：EPubBuilder终极指南

二叉搜索树（BST）与哈夫曼树（HFM）

洛谷-P11315 [RMI 2021] 速通 / Speedrun 题解

操作系统VFS虚拟文件系统的理解

三月七小助手：7倍效率提升的崩坏星穹铁道全自动智能工具

2. Ubuntu安装dify（图文分享）

00华夏之光永存：黄大年茶思屋榜文解法鸿蒙生态全场景通信核心卡脖子难题前瞻解析

刚刚，梁文锋被曝史上首次融资！DeepSeek V4彻底摆脱英伟达,不低于100亿美元的估值

最新文章

基于深度徐恶习的YOLOv8和YOLOv11的汽车Logo识别 汽车品牌视频实时检测项目

中兴光猫管理神器zteOnu：一键开启工厂模式与永久Telnet

p90RSK重组兔单抗能否解析激酶信号的多维调控？

p90RSK兔多克隆抗体能否覆盖激酶信号的全谱检测？

[工业互联-16] 从通用到确定：实时Linux内核补丁PREEMPT-RT的演进与工业实践

从零手搓一个DES-CBC加密库：用C语言一步步还原经典算法（附完整源码）

推荐文章

工业通信协议：Modbus与OPC UA的解析与实现

Verilog仿真翻车现场：Testbench里这些‘坑’你踩过几个？（含$monitor、defparam避坑指南）

Python自动化新手福音：用uiautomator2+Weditor搞定安卓APP元素定位（保姆级避坑）

Path of Building完全指南：5步掌握流放之路最强Build规划工具

保姆级避坑指南：在Ubuntu 16.04上搞定Kinect v2驱动与ORB-SLAM2环境搭建

Java CompletableFuture 并发链式任务管理

相关文章

分享文章

更多文章

基于深度徐恶习的YOLOv8和YOLOv11的汽车Logo识别汽车品牌视频实时检测项目