PANews 1月21日消息,据量子位报道,DeepSeek在GitHub更新的FlashMLA代码中首次出现“MODEL1”名称,覆盖114个文件中28处提及,且与现有版本V32(DeepSeek-V3.2)并列,暗示MODEL1为下一代新架构模型。代码差异显示该模型在KV缓存布局、稀疏性处理及FP8解码等方面进行了优化,或将在春节前后正式发布。结合近期公开的mHC残差连接机制与Engram记忆模块,MODEL1有望整合多项自研创新。
DeepSeek新模型MODEL1代码曝光,疑为全新架构
免责声明:本文版权归原作者所有,不代表MyToken(www.mytokencap.com)观点和立场;如有关于内容、版权等问题,请与我们联系。
更多精彩内容请查阅
X(https://x.com/MyTokencap)或加入社区了解更多MyToken-官方华文电报群
(https://t.me/mytoken_cn)
X(https://x.com/MyTokencap)或加入社区了解更多MyToken-官方华文电报群
(https://t.me/mytoken_cn)
相关阅读



稳定币收益项目Osero完成1350万美元融资,Sky Ecosystem领投
PANews 5月12日消息,据The Block报道,稳定币收益基础设施项目 Osero 完成 1350 万美元融资,由 Sky Ecosystem(原 MakerDAO)领投,Plasma 参投,...
PANews2026-05-12 14:58:00

Gradients:Bittensor生态的去中心化AI训练基础设施
Gradients 补齐了 TAO 生态中的训练基础设施,并探索“市场驱动 AI 优化”的新范式,长期有潜力发展为去中心化 AI 训练的重要入口层。...
PANews2026-05-12 14:44:00

eBay董事会否决GameStop约560亿美元收购要约
PANews 5月12日消息,据 CoinDesk 报道,eBay 董事会已拒绝 GameStop 提出的约 560 亿美元收购要约,该交易拟以一半现金、一半股票形式完成。eBay 在声明中称,该要约...
PANews2026-05-12 13:51:00