DeepSeek-V3.2-Exp模型开源发布重磅消息
2025年9月29日,DeepSeek-V3.2-Exp模型正式发布并开源。模型引入稀疏 Attention 架构,这种架构能够有效降低计算资源消耗并提升模型推理效率。目前,该模型已正式上架华为云大模型即服务平台 MaaS,针对DeepSeek-V3.2-Exp 模型,华为云此次仍沿用大EP并行方案部署,基于稀疏Attention结构叠加实现长序列亲和的上下文并行策略,并兼顾模型时延和吞吐性能。
2025年9月29日,DeepSeek-V3.2-Exp模型正式发布并开源。模型引入稀疏 Attention 架构,这种架构能够有效降低计算资源消耗并提升模型推理效率。目前,该模型已正式上架华为云大模型即服务平台 MaaS,针对DeepSeek-V3.2-Exp 模型,华为云此次仍沿用大EP并行方案部署,基于稀疏Attention结构叠加实现长序列亲和的上下文并行策略,并兼顾模型时延和吞吐性能。
9月25日,奇瑞汽车(9973.HK)正式登陆港交所,股价一度大涨超13%。截至发稿前,其股价涨幅回落至10.44%,报33.96港元/股,市值为1958.6亿港元。 此次上市,奇瑞汽车以30.75港元/股的招股价上限定价,募资规模达91.4亿港元,成为年内港股市场规模最大的车企IPO...
现货黄金日内涨0.8%,向上触及3780美元/盎司。...
随着中交地产(证券简称:*ST中地,证券代码:000736)重大资产重组完成资产交割,上市公司房地产开发业务相关的资产和负债置出至控股股东中交房地产集团有限公司,中交地产管理层出现重大变动。 原董事长、总裁等一众高管集体请辞,并聘任新的总裁、副总裁和财务总监等高管。新的总裁人选为曾益明,他此前...
9月26日,宇树科技创始人、CEO王兴兴在第四届全球数字贸易博览会上发言称,宇树科技机器人算法今年已经历几次迭代,预计下半年将发布身高1.8米的人形机器人。 王兴兴表示,今年上半年国内机器人行业发展火热,中国智能机器人相关企业平均增长率达50%到100%。前段时间宇树科技再次更新了算法,使机器...
9月25日晚,上纬新材(688585.SH)发布公告称,公司股票自2025年7月9日至9月25日期间多次触及股票交易异常波动及严重异常波动情形,最近两个交易日连续涨停。 经向上海证券交易所申请,本公司股票将于2025年9月26日(星期五)开市起停牌,自披露核查公告后复牌。这也是公司股票自7月9...
记者 张一诺 2025年是“十四五”规划收官之年,下半年经济运行对全年目标任务实现及中长期发展布局具有重要影响。 今年三季度以来,受极端天气、稳增长政策节奏、外部环境等多重因素影响,中国经济增长动能有所下降。分析人士指出,四季度有望出台一揽子新措施推动经济回升向好,核心是财政加力...