DeepSeek-V3.2-Exp模型开源发布重磅消息
2025年9月29日,DeepSeek-V3.2-Exp模型正式发布并开源。模型引入稀疏 Attention 架构,这种架构能够有效降低计算资源消耗并提升模型推理效率。目前,该模型已正式上架华为云大模型即服务平台 MaaS,针对DeepSeek-V3.2-Exp 模型,华为云此次仍沿用大EP并行方案部署,基于稀疏Attention结构叠加实现长序列亲和的上下文并行策略,并兼顾模型时延和吞吐性能。
2025年9月29日,DeepSeek-V3.2-Exp模型正式发布并开源。模型引入稀疏 Attention 架构,这种架构能够有效降低计算资源消耗并提升模型推理效率。目前,该模型已正式上架华为云大模型即服务平台 MaaS,针对DeepSeek-V3.2-Exp 模型,华为云此次仍沿用大EP并行方案部署,基于稀疏Attention结构叠加实现长序列亲和的上下文并行策略,并兼顾模型时延和吞吐性能。
界面新闻记者 | 尹靖霏 近日,丹诺医药(苏州)有限公司(下称丹诺医药)向港交所递交招股书,拟在主板上市,这一动作立即引发资本市场的高度关注。 丹诺医药的幽门螺杆菌新药利福特尼唑(TNP-2198)正迎来商业化前的“惊险一跃”——这款全球首创、已挺进III期临床终点的差异化抗生素,被公司...
9月17日晚,“OTC龙头”华润三九(000999.SZ)发布公告称,为了合理利用闲置资金,在充分考虑公司未来营运资金及综合评估风险和收益的前提下,公司及公司子公司拟以合计不超过人民币100亿元自有资金投资银行及其下属银行理财子公司理财产品(不含珠海华润银行理财产品)。资金可滚动使用,单笔产品期限不...
美股三大指数集体高开,道指涨0.45%,纳指涨0.08%,标普500指数涨0.2%。格芯(GlobalFoundries)涨超11%,此前报道称美国计划出台芯片生产新规以降低对海外依赖。英特尔涨超3%,有报道称其接触台积电寻求投资或合作。波音涨超4%,小鹏汽车、理想汽车涨超2%;金山云跌超8%。...
界面新闻记者 | 陈靖 又有券商批量“甩卖”资产。 近日,西南证券(600369.SH)在重庆联合产权交易所集中挂牌一批资产转让项目。界面新闻记者不完全统计发现,此次挂牌项目数量约70个,涵盖车位、房产及机动车,转让底价合计约487.82万元,而这一系列资产处置动作,均与此前公司...
界面新闻记者 | 朱咏玲界面新闻编辑 | 楼婍沁 SHANG XIA七夕臻选系列传递东方情意 东方雅致生活方式品牌SHANG XIA上下推出七夕浪漫臻选系列,以传统丝绸工艺与中式吉祥符号,凝练成一份跨越时空的东方情意。新品涵盖丝巾手绳、桑蚕丝印花围巾及绒花胸针等臻品,以爱为结,寄托祈愿。...
界面新闻记者 赵阳戈 特种光纤企业武汉长进光子技术股份有限公司(以下简称“长进光子”)提交科创板IPO申请,计划募资额为7.8亿元,引发市场关注。实控人李进延是华中科技大学博士研究生导师,于今年5月正式全职加入公司。 长进光子依托高校资源,在特种光纤领域实现关键技术突破。然而,公...