心理所研發腦影像多中心大數據去站點效應標準化推薦方案
腦影像已邁入大數據時代,這意味著需要進行多中心腦影像大數據合作研究,而有效地去除站點效應以實現多中心數據標準化融合,是其中關鍵一步。近日,中國科學院行為科學重點實驗室嚴超贛研究組的研究人員針對靜息態功能磁共振成像(resting-state functional magnetic resonance imaging, R-fMRI)數據融合的站點效應問題,進行了全面的評估,并提出了一套有效地去站點效應的標準化推薦方案。
在多個數據集中,研究人員對各種R-fMRI指標的去站點效應策略進行了全面評估,包括測試殘留站點效應、個體識別能力、重測信度、統計結果的可重復性,以及站點和性別完全混淆情境下的表現。在個體識別能力(即在不同站點掃描的R-fMRI數據中,是否能識別出同一受試者)上,研究發現,雖然大多數方法都減少了站點效應,但是基于子采樣最大平均距離的分布偏移校正算法(Subsampling Maximum-mean-distance based distribution shift correction Algorithm, SMA)和基于參數的未校正的CovBat在個體識別能力(聚類準確性)方面優于線性回歸模型、線性混合模型、ComBat系列和不變條件變分自編碼器(ICVAE)。在重測信度方面,SMA和基于參數的校正的CovBat優于未校正的ComBat系列和基于參數的未校正的CovBat。同時,SMA在Dice系數和大腦性別差異的可重復性方面優于后者。此外,SMA在站點和性別完全混淆情境下能更好地檢測到ALFF的可重復的性別差異。為了優化SMA的識別能力、重測信度和穩定性,研究人員設計了實驗來確定最佳目標站點特征。他們注意到目標站點的樣本量和分布都很重要,并提出了一種啟發式公式來選擇目標站點。

圖1 研究框架和數據
(A) 評價框架。研究者從三個數據集——TSP-3、CoRR 和 FCP(步驟 1)中提取了五個廣泛使用的 R-fMRI 指標。然后分別用 11 種方法去除它們的站點效應(步驟 2)。研究者從五個角度評估這些方法:殘留站點效應(均值、方差和協方差)、個體可識別性、重測可靠性、可復制性以及站點和性別完全混淆的極端情況(步驟 3)。 (B) 這項工作中使用的數據集的人口統計信息。這包括數據集和站點名稱、年齡分布以及每個站點的女性和男性數量。 (C) 詳細評估過程。每個數據集都對殘留站點效應進行檢測。對在三個站點旅行的 41 名受試者進行了個體層面的鑒定。研究者使用分層聚類對 123 張圖像進行聚類,通過聚類正確率評估屬于每個被試的 3 張圖像在校正后是否可以正確地分組在一起(第一行)。性別(男性與女性)的組水平統計分析:重復掃描 CoRR(重測信度,第二行)和 CoRR 和 FCP(可復制性,第三行)之間的Dice系數,以及站點和性別完全混淆(第四行)
基于以上研究結果,研究團隊推薦了基于SMA的腦影像多中心大數據去站點效應標準化推薦方案。這項工作還將為繼續改進和創新腦影像大數據的標準化方法提供有力支持,有助于進一步提高多中心神經影像研究的準確性和可靠性。研究團隊已經將所有數據開源在心理科學數據銀行,代碼開源在github,并將在下一個版本的DPABI中發布DPABI Harmonization多中心數據去站點效應模塊,將提供包含SMA、ComBat,CovBat和其他方法的用戶友好操作平臺,以此推動領域對該方法的使用和檢驗。

圖2 研究主要結果
(左上角)個體識別正確率:SMA和ComBat、CovBat方法兩兩進行統計檢驗。標紅數字表示SMA校正后的個體識別正確率顯著高于該方法校正后的個體識別正確率,紫色反之。(右側)性別統計結果的重測信度和可重復性:對SMA和其他方法進行統計比較,紅色標注出的方法在量化的評估指標上顯著低于SMA,黑色則表示無統計學差異。(左下角)性別和站點完全混淆的極端情況:研究者比較了來自 FCP-Cambridge 的 74 名男性和來自 FCP-Beijing 的 106 名女性的 ALFF 性別差異,CoRR-SWU站點的重測數據協助ComBat、CovBat 和 SMA 方法進行校正。前兩列對應CoRR-SWU兩次重測數據分別協助校正后的性別統計差異,第三列是前兩列重疊的結果,將第三列結果與可復制的性別統計差異(右下角,深綠色框)結果進行對比。同時給出了CoRR-SWU兩次重測數據性別差異的可復現結果(左下角,亮綠色框)
研究團隊表示,隨著大數據神經影像技術的飛速發展,去站點效應標準化方案將在基礎研究和臨床應用研究中發揮關鍵作用。該方法能夠提高跨站點神經影像數據的整合能力,從而為研究者提供更加豐富和準確的大數據資源。這將有助于揭示大腦功能的更多秘密,為神經科學和心理學的進一步發展提供有力支持。未來,研究人員將繼續關注去站點效應標準化方案在其他神經影像技術領域的應用,如結構磁共振成像、彌散張量成像等,并探索其在腦影像大數據深度學習中的優化策略。總之,心理所研發的腦影像多中心大數據去站點效應標準化推薦方案為神經影像領域帶來了創新性的解決方案,將為多中心大數據研究提供有力支持,有助于解鎖更多關于大腦功能和心理學的奧秘。
此研究已在線發表于神經影像學期刊NeuroImage,同時該工作被2023年國際人腦圖譜學會年會(OHBM)遴選為口頭報告。第一作者是心理所博士生王瑀薇,通訊作者為嚴超贛研究員。
該項目受到科技創新2030-腦科學與類腦研究重大項目(2021ZD0200600)、國家重點研發計劃(2017YFC1309902)、國家自然科學基金(82122035、81671774、81630031)、中國科學院十三五信息化規劃(XXH13505)、中國科學院重點研究計劃(ZDBS-SSW-JSC006),北京市科技新星計劃(Z191100001119104),以及中國科學院心理研究所科學基金(E2CX4425YZ)的資助。
論文信息:
Wang, Y.W., Chen, X., Yan, C.G. (2023). Comprehensive evaluation of harmonization on functional brain imaging for multisite data-fusion. Neuroimage, 120089, doi:10.1016/j.neuroimage.2023.120089.
附件下載: