PANews 1月21日消息,据量子位报道,DeepSeek在GitHub更新的FlashMLA代码中首次出现“MODEL1”名称,覆盖114个文件中28处提及,且与现有版本V32(DeepSeek-V3.2)并列,暗示MODEL1为下一代新架构模型。代码差异显示该模型在KV缓存布局、稀疏性处理及FP8解码等方面进行了优化,或将在春节前后正式发布。结合近期公开的mHC残差连接机制与Engram记忆模块,MODEL1有望整合多项自研创新。
DeepSeek新模型MODEL1代码曝光,疑为全新架构
免责声明:本文版权归原作者所有,不代表MyToken(www.mytokencap.com)观点和立场;如有关于内容、版权等问题,请与我们联系。
相关阅读


马斯克:不要类比,从第一性原理思考!
马斯克倡导“第一性原理”思维:从本质出发,拆解问题至底层,而非依赖类比。以电池成本为例,原料实际价值远低于传统认知,揭示创新需重构底层逻辑。...
PANews2026-01-21 02:58:14

Solana Mobile推出原生代币SKR,Seeker用户可在4月20日前申领空投
SKR现已正式上线Solana主网,超20亿枚SKR将在本轮空投中分配给Seeker Season 1的用户与开发者。用户可在Seeker设备内通过Seed Vault Wallet领取并质押SKR,...
PANews2026-01-21 02:25:29
当华尔街还在争论,数字人民币先给用户“分钱”了
数字人民币告别M0成为M1,支持持币生息,银行可自主开发增值服务,智能合约支持可编程支付,加速跨境应用。而数字人民币要想真正完成从政策工具到大众产品的跃迁,真正的考验,或许才刚刚开始。但其路径和潜力已...
PANews2026-01-21 02:15:00