K8凯发(中国) 用Attention和MoE预告天气,刷新公里级斟酌SOTA
近日,联想机视觉限度顶级外洋会议CVPR 2026公布了论文寄托效果。本次会议共收到 16,092 篇投稿,最终寄托 4,090 篇,合座寄托率为25.42%,其中仅有约2.5%的论文被评为Highlight Paper。

由香港科技大学郭嵩院士(IEEE Fellow)团队与上海 AI 实践室相助完成的论文《STCast: Adaptive Boundary Alignment for Global and Regional Weather Forecasting》到手入选 CVPR 2026 Highlight Paper。
该职责建议了一种全新的时空天气预告框架 STCast,通过自合适领域对都和时辰搀杂大家模子,在大家预告、区域预告、台风旅途斟酌和蚁集预告四大任务上全面杰出现存尺度,得回了SOTA 性能。
盘考配景与动机
准确的公里级区域天气预告是一项具有深入社会经济影响的要紧科学挑战。现存的区域预告战略主要分为两类:
考试专用区域模子
忽略了瞄准确预告至关紧迫的跨区域依赖关系
从大家预告中剪辑区域
受限于静态且不精准的区域领域,泛化才能差
传统数值天气预告 ( NWP ) 尺度通过求解偏微分方程来处理领域问题,但联想本钱极高。而现存的 AI 尺度持续只使用相邻区域来界说领域,这与熟识的"大气 - 海洋 - 陆地 - 生物圈耦合表面"相矛盾——该表面标明,区域大气中的任何少量都受到通盘地球系统的影响。举例,西伯利亚的寒潮不错激发东亚的寒潮,青藏高原的地表加热不错同期改变东亚季风和北好意思激流。
为了处治这些挑战,团队建议了STCast 框架,它明确地模拟了地球系统中不休演变的大家 - 区域联系性。
三种区域预告战略对比
团队对比了三种主流的区域天气预告战略:

上图中,图 ( 1 ) 是三种区域预告战略暗示图:
( a ) 现存 AI 尺度:从大家预告中剪辑相邻区域,与区域变量沿途进行预告;
( b ) 重新径直考试:仅使用议论区域的数据考试模子;
( c ) 团队的尺度 ( STCast ) :通过散布密集伙同大家 - 区域模子进行预告。
图 ( 2 ) 是三种战略的区域预告性能对比。
定量效果标明,STCast 在扫数变量的平均 RMSE 和 ACC 上都得回了最好性能,显赫优于径直考试和 OneForecast 尺度。这验证了团队的动态、地球感知领域机制优于基于静态邻居的耦合尺度。
STCast 合座架构
STCast 是一个协调的时空天气预告框架,大要同期处理四大关键任务:

△图 2:STCast 合座架构图
( a ) 低诀别率大家预告:包含编码器、处理器息争码器,集成了 Temporal MoE 模块;
( b ) 高诀别率区域预告:通过 Spatial-Aligned Attention 模块和会大家和区域信息;
( c ) 台风旅途斟酌:专揽斟酌的高诀别率 MSL 来揣摸台风旅途;
( d ) 持久预告和蚁集预告:通过注入 Perlin 噪声生成多个预告蚁集。
STCast 的中枢改革在于两个关键模块:Spatial-Aligned Attention ( SAA ) 和Temporal Mixture-of-Experts ( TMoE ) 。
中枢改革一:Spatial-Aligned Attention ( SAA )
Spatial-Aligned Attention 模块将全局特征动作 Query 和 Key,将区域特征动作 Value,通过线性交叉提神力动态耦合大家和区域特征。

△图 3:Spatial-Aligned Attention 暗示图
SAA 的关键机制包括:
大圆距离度量
更准确地测量地球名义上的空间关系
指数距离衰减函数
开动化可学习的大家 - 区域散布,确保远距离区域的影响较弱
高效提神力机制
将联想复杂度从 O ( n ² ) 镌汰到 O ( n )
通过这种样子,SAA 建造了一个最优的大家 - 区域散布,K8凯发该散布在考试经由中不休优化,大要捕捉大家和区域大气款式之间的潜在联系性。
中枢改革二:Temporal Mixture-of-Experts ( TMoE )
有计划到大气变量在不同月份存在显赫各异,Temporal Mixture-of-Experts 将每个月的预告视为相对零丁的任务,并使用搀杂大家模子来组织这些任务。

△ 图 4:Temporal Mixture-of-Experts 暗示图
TMoE 的关键机制包括:
闹翻高斯散布
为每个月学习一个高斯散布来表露那时辰特征
旋转对都
将月份序列旋转对都到输入变量,确保激活概率随时辰距离单调递减
多大家激活
增强路由千般性,退缩大家同质化
实践效果 1. 低诀别率大家预告
团队在 ERA5 数据集上评估了 STCast 的大家预告性能,与 Pangu-Weather、Graphcast、Fuxi 和 OneForecast 等主流尺度进行了对比。

△ 表 1:大家天气预告性能对比
效果标明,STCast 在扫数基准测试中都进展出一致的优厚性,畸形是在持久斟酌方面得回了显赫的擢升。这成绩于团队的月份特定考试战略,它大要灵验地捕捉大气系统中的季节依赖和月际变化。
2. 高诀别率区域预告

△ 图 5:东亚区域的高诀别率预告实践:径直考试、OneForecast 和 STCast 尺度对比
在东亚区域的高诀别率预告实践中,团队对比了径直考试、OneForecast 和 STCast 三种尺度。效果显现,终了动态领域条款的 STCast 比较径直考试的 STCast(无动态领域)和 OneForecast,RMSE 镌汰了 0.05,ACC 提高了 0.1。
3. 顶点事件评估:台风旅途斟酌
团队评估了 STCast 在两个近期台风事件上的进展:2024 年 5 月的台风艾云尼 ( Ewiniar ) 和 2024 年 11 月的台风银杏 ( Yinxing ) 。

△图 6:台风旅途斟酌效果
效果显现,STCast 的 72 小时旅途预告与不雅测旅途的吻合度较着高于 ECMWF、FourCastNet、Pangu-Weather 和 FengWu。畸形是在台风银杏的持久斟酌中,STCast 的平均谬误仅为 96.5 公里,而次优的 Pangu-Weather 为 160 公里。
消融盘考
团队进行了全面的消融盘考来验证每个模块的灵验性:

△表 2:消融盘考效果
效果标明,移除任何组件都会导致区域和大家任务的性能下落。最显赫的下削发削发生在移除大家 - 区域散布 ( 区域任务:10 天 RMSE 增多 0.22 ) 和月份镶嵌 ( 大家任务:10 天 RMSE 增多 0.13 ) 时,这说明了每个组件在擢升 STCast 合座灵验性方面的关键作用。
论断
在这项职责中,团队在 Spatial-Aligned Attention 模块中引入了自合适提神力求,为区域预告提供动态领域条款。除了区域任务外,团队还将 Temporal Mixture-of-Experts 镶嵌到时空预告框架 STCast 中,将天气预告视为一个多任务问题,并将月度子任务寄托给有利的大家。
因此,STCast 同期处治了四个不同的挑战:低诀别率大家预告、高诀别率区域预告、顶点事件评估和蚁集天气预告。实践和消融盘考据实,STCast 在扫数评估场景中都长久优于竞争尺度。
论文集结:https://arxiv.org/pdf/2509.25210v3
代码仓库:https://github.com/chenhao-zju/STCast
一键三连「点赞」「转发」「提神心」
接待在评述区留住你的念念法!
— 完 —
咱们正在招聘又名眼疾手快、怜惜 AI 的学术编著实习生 � �
感好奇钦慕的小伙伴接待怜惜 � � 了解敬佩

� � 点亮星标 � �
科技前沿进展逐日见K8凯发(中国)
UED体育中国官方网站入口