DeepSeek-V3.2-Exp模型开源发布重磅消息
2025年9月29日,DeepSeek-V3.2-Exp模型正式发布并开源。模型引入稀疏 Attention 架构,这种架构能够有效降低计算资源消耗并提升模型推理效率。目前,该模型已正式上架华为云大模型即服务平台 MaaS,针对DeepSeek-V3.2-Exp 模型,华为云此次仍沿用大EP并行方案部署,基于稀疏Attention结构叠加实现长序列亲和的上下文并行策略,并兼顾模型时延和吞吐性能。
2025年9月29日,DeepSeek-V3.2-Exp模型正式发布并开源。模型引入稀疏 Attention 架构,这种架构能够有效降低计算资源消耗并提升模型推理效率。目前,该模型已正式上架华为云大模型即服务平台 MaaS,针对DeepSeek-V3.2-Exp 模型,华为云此次仍沿用大EP并行方案部署,基于稀疏Attention结构叠加实现长序列亲和的上下文并行策略,并兼顾模型时延和吞吐性能。
界面新闻记者 | 杨诗涵 周姝祺 刘嘉欣 庄键界面新闻编辑 | 赵柏源 2025年3月29日,三名女大学生自驾从湖北出发,她们准备去安徽池州参加次日的事业编考试。其中一个女孩的男朋友给她买了这辆小米SU7,她曾经驾驶这辆车从湖北开到广东。 开车女孩的母亲曾告诫她,不要盲目相信智驾,还是自...
界面新闻记者 | 梁宝欣 8月27日,香港数字资产上市公司联合会(HKVALA)正式成立。这标志着香港数字资产行业进入到生态协同的制度化新阶段。 从成立背景来看,香港数字资产上市公司联合会的成立主要受三方面因...
界面新闻记者 赵阳戈 特种光纤企业武汉长进光子技术股份有限公司(以下简称“长进光子”)提交科创板IPO申请,计划募资额为7.8亿元,引发市场关注。实控人李进延是华中科技大学博士研究生导师,于今年5月正式全职加入公司。 长进光子依托高校资源,在特种光纤领域实现关键技术突破。然而,公...
9月10日,广州富力地产(02777.HK)发布公告,鉴于公司整体经营现状,公司拟初步为公司境内公司债券持有人提供整体境内债券重组方案,包括现金购回、以物抵债、应收账款信托份额抵债、资产信托份额抵债、股票经济收益权兑付和全额留债长展期,具体如下: (一)现金购回:公司拟对债券分三次进行折价(每...
界面新闻记者 | 伍洋宇界面新闻编辑 | 文姝琪 2024年年初的一天,小米AI眼镜负责人李创奇发起了一场不太日常的对话。 他将一份文件拖进小米内部办公软件自己与雷军的聊天窗口,一边打下这样一段文字:“……就...
界面新闻记者 | 张熹珑 为了吸引港澳青年本地创业,广州南沙区持续加码政策扶持。 今年以来,该区新修订“鼓励支持港澳青年创业就业实施细则”,对比以往政策进一步加大力度,例如部分创业类、活动类、生活类补贴奖补期限将“每年一次”改为“每半年申请一次”,以及将落户补贴、创业成长奖励申请条件“涉...