面上,华为正式发布AI推理创新技术UCM,融合多类型缓存加速算法工具,通过分级管理推理过程中产生的KV Cache记忆数据,扩大推理上下文窗口,实现高吞吐、低时延的推理体验。这项突破性成果有望降低中国AI推理对HBM技术的依赖。英伟达推出一系列面向机器人开发者的世界模型、应用库和基础设施,其中开源的70亿参数推理精密、工业富联、中兴通讯、兆易创新、沪电股份、东山精密、歌尔股份、生益科技。