DeepSeek-V3.2-Exp模型开源发布重磅消息
2025年9月29日,DeepSeek-V3.2-Exp模型正式发布并开源。模型引入稀疏 Attention 架构,这种架构能够有效降低计算资源消耗并提升模型推理效率。目前,该模型已正式上架华为云大模型即服务平台 MaaS,针对DeepSeek-V3.2-Exp 模型,华为云此次仍沿用大EP并行方案部署,基于稀疏Attention结构叠加实现长序列亲和的上下文并行策略,并兼顾模型时延和吞吐性能。
2025年9月29日,DeepSeek-V3.2-Exp模型正式发布并开源。模型引入稀疏 Attention 架构,这种架构能够有效降低计算资源消耗并提升模型推理效率。目前,该模型已正式上架华为云大模型即服务平台 MaaS,针对DeepSeek-V3.2-Exp 模型,华为云此次仍沿用大EP并行方案部署,基于稀疏Attention结构叠加实现长序列亲和的上下文并行策略,并兼顾模型时延和吞吐性能。
界面新闻记者 | 孙艺真 年内新股上市数量整体上出现回暖迹象,仍有企业在IPO注册“临门一脚”之际“折戟”。 界面新闻根据三大交易所网站项目审核动态统计,今年年内,共有7家企业过会后注册失败。究其原因,多名市场人士向界面新闻分析,注册流程耗时过长、市场环境变化、企业自身调整是导致上述企业...
界面新闻记者 | 张艺 近期股价放量大涨、市值重返千亿规模的精密结构件龙头领益智造(002600.SZ)披露了2025年中期业绩报告。 领益智造上半年实现营业收入236.25亿元,同比增长23.35%;实现归属于上市公司股东的净利润9.30亿元,同比增长35.94%。这份“成绩单”基本符...
9月8日,越秀房产信托基金(00405.HK)发布公告,披露有关约34.33亿元出售越秀金融大厦50%权益情况。 公告称,于9月8日订立股权转让协议,拟向关联方广州越秀发展集团有限公司出售广州越秀金融大厦50%权益,此后,将余下的50%权益转让予内部重组方(即越秀房产基金的非全资附属公司)。...
9月25日,韩建河山(603616.SH)发布公告称,公司于当天收到北京证监局出具的《关于对北京韩建河山管业股份有限公司、田玉波、孙雪、魏良彬、张海峰采取出具警示函措施的决定》(以下简称《决定书》)。 《决定书》显示,经查,韩建河山存在以下违规行为: 财务核算不规范。广西某项目不符合收入...
界面新闻记者 | 肖芳界面新闻编辑 | 文姝琪 从去年就在寻找新故事的爱奇艺,又看中了线下娱乐业。 在2025爱奇艺iJOY秋季悦享会上,爱奇艺创始人、首席执行官龚宇在演讲中明确,线下业务未来将是爱奇艺的核心...
9月27日,柬埔寨国防部发言人马莉淑洁达表示,当天上午,泰国军方开始向边境地区的柬军阵地开火。柬军保持高度克制,未进行还击。截至目前,泰方仍在持续向柬军开火,并未停止。 柬埔寨方面表示,柬方坚定致力于全面、一贯尊重和执行柬泰停火协议,继续在各层面密切合作,寻求务实合作,促进两国和平稳定,早日恢复正...