科研进展

IEEE TMI | 生成式AI解锁脑电与脑血氧信号“跨模态对话”

时间:2025-03-27  来源:数字所 文本大小:【 |  | 】  【打印

人脑功能活动的捕捉如同在迷雾中绘制星图,需要多模态技术的协同。功能性磁共振成像(fMRI)凭借毫米级空间分辨率,在脑机工程研究中被视为脑功能解码的金标准数据,但其笨重的设备、高昂的成本和低时间分辨率限制了应用潜力。与之互补的脑电图(EEG)虽能毫秒级捕捉电信号,却像“雾里看花”,信噪比低且难以定位深层脑区活动。如何让两者优势融合提升脑功能解码精度和可用性是脑机接口研究中的重要挑战。

为突破这一瓶颈,中国科学院深圳先进技术研究院王书强课题组提出了一种创新的解决方案-通过构建条件对齐时序扩散模型(CATD),实现脑电-脑血氧信号的统一表征。团队相关工作近日在IEEE Transactions on Medical Imaging发表了题为CATD: Unified Representation Learning for EEG-to-fMRI Cross-Modal Generation的研究成果,首次实现了基于扩散学习的EEG到fMRI跨模态表征,将BOLD信号时间分辨率提升3倍,为便捷获取高质量脑功能信号提供新方案。

如果把EEG信号比作“闪电快照”,BOLD信号则是“延时摄影”——前者记录毫秒级神经元放电,后者反映秒级血氧代谢。二者虽同源,却因时空尺度差异如同“加密语言”。

CATD框架通过两项核心技术破解这一密码:

(1)“脑信号翻译官”条件对齐块(CAB)

研究团队创新设计CAB模块,借助跨模态注意力机制,将EEG的“时间密码”与BOLD的“空间密码”对齐至同一潜在空间。这一过程模拟了人脑神经血管耦合机制——当神经元放电后约6秒,血氧水平随之波动。通过捕捉这种延迟关联,AI能精准翻译两种信号的内在逻辑。

(2)“时间显微镜”动态时频分割(DTFS)

传统BOLD信号每秒采集1次,难以捕捉癫痫发作等瞬态事件。团队开发的DTFS模块,通过滑动采样将EEG信号切割为毫秒级片段,驱动AI生成时间分辨率提升3倍的BOLD信号。实验显示,合成信号在癫痫早期征兆检测中,时间相关性(余弦相似度)达0.85,媲美真实数据。

全球约70%的医院配备EEG设备,但仅5%拥有fMRI。团队提出的这一解决方案可基于海量EEG数据生成多模态脑影像库,助力帕金森、抑郁症等脑疾病神经调控机制研究。

数字所研究生姚玮珩为论文第一作者,王书强研究员为论文通讯作者,该研究工作得到了国家重点研发计划、国家自然科学基金等科技项目资助。


图1. CATD模型图


图2. EEG-fMRI 跨模态增强在运动想象等下游任务中的验证分析