PANews 1月21日消息,据量子位报道,DeepSeek在GitHub更新的FlashMLA代码中首次出现“MODEL1”名称,覆盖114个文件中28处提及,且与现有版本V32(DeepSeek-V3.2)并列,暗示MODEL1为下一代新架构模型。代码差异显示该模型在KV缓存布局、稀疏性处理及FP8解码等方面进行了优化,或将在春节前后正式发布。结合近期公开的mHC残差连接机制与Engram记忆模块,MODEL1有望整合多项自研创新。
DeepSeek新模型MODEL1代码曝光,疑为全新架构
免责声明:本文版权归原作者所有,不代表MyToken(www.mytokencap.com)观点和立场;如有关于内容、版权等问题,请与我们联系。
相关阅读



CoinShares携手Kiln推出基于Railnet的链上资产管理策略
CoinShares宣布与机构级链上收益基础设施提供方Kiln合作,利用其Railnet协议推出首个链上资产管理策略,将DeFi协议收益与代币化真实世界资产(RWA)收益整合至单一合规产品中。据介绍,...
PANews2026-03-18 14:23:00
链上“余额宝”时刻:收益型稳定币狂飙背后的流动性迁徙
收益型稳定币正迎来链上“余额宝”时刻。过去约半年,其规模由约110亿美元扩张至约227亿美元,在全球稳定币总市值约3200亿美元背景下,占比由约4.5%升至约7.4%。这轮增长背后,不只是高息驱动,更...
PANews2026-03-18 13:58:00

S&P推出首个官方授权S&P 500永续合约登陆Hyperliquid
PANews 3月18日消息,据PR Newswire报道,S&P Dow Jones Indices宣布将S&P 500指数授权给[TradeXYZ],在去中心化公链Hyperliquid上推出首个...
PANews2026-03-18 13:31:00