心理所研究抑郁患者與健康人語音的跨情境差異

發布時間：2019-10-25 作者：中國科學院行為科學重點實驗室朱廷劭研究組汪靜瑩【小中大】【打印】【關閉】

　　抑郁癥（MDD）是一種以持久的抑郁情緒為核心癥狀的心境障礙。作為情感表達的一種方式，研究發現聲音可能是一種潛在的識別抑郁的手段。人們不僅發現聲音與MDD患者的神經認知功能障礙有關，一些聲音特征與抑郁得分顯著相關，還發現抑郁患者與健康人在一些聲音特性上存在差別。雖然已有不少異常特征的發現，但抑郁患者的這些異常是普遍存在的還是僅存在于某些特殊情境下仍不得而知。

　　研究這一問題需要考慮兩個影響因素：一個是任務，研究已發現不同的任務可能會對語音特征產生不同的影響，這是由于不同的任務參與的認知功能不同導致的；另一個是情緒，研究表明不同的情緒有不同的聲音表達模式。因此，在實驗設計中，應當充分考慮以上兩個因素去設計相應的語音情境。

　　中國科學院行為科學重點實驗室朱廷劭研究組采集了47個健康人與57個抑郁癥患者在12種言語情景下的聲音。研究將抑郁組在四種任務（視頻觀看、問題回答、文本朗讀和圖片描述）下的積極、消極和中性語音分別與健康組在相同情境下的語音相比較。在將教育水平作為協變量控制的情況下，通過多元協方差分析（MANCOVA）評估了抑郁組和健康組在上述12種情景下的25個語音特征的差異。25個語音特征包括音量（Loudness）、基頻（F0）、基頻包絡（F0 envelope）、過零率（Zero-crossing rate）、清濁比（Voicing probability）、12個梅爾倒譜系數（Mel-frequency cepstrum coefficient，MFCC）和8個線性頻譜對（Line Spectral Pairs）。由于存在多重假設檢驗的情況，本研究以“p < 0.001”為顯著性水平的標準。

　　MANCOVA結果顯示，在12種語音情景中，兩個組別均存在有顯著性差異的語音特征。如圖1所示，在不同情景下，顯著的聲學特征數量并不完全相同。結果還顯示，響度、MFCC5和MFCC7三個語音特征在所有12種語音情景下都始終體現出顯著的組別差異。根據本研究的結果，抑郁語音的表現是無力（weak）、低沉（low-pitched）和少抑揚頓挫（untoned）。

圖1. 不同情境下顯著語音特征的數量

VW，視頻觀看；QA，問題問答；TR，文本朗讀；PD，圖片描述；Pos，積極；neu，中性；neg，負性

　　綜上，本研究表明抑郁癥患者聲音異常存在跨情境穩定性，響度、MFCC5和MFCC7具備成為聲音識別抑郁癥的行為指標的潛質。本研究為未來建立穩健有效的抑郁語音識別模型提供了有力的依據。

　　以上研究受國家重點研究發展項目和中國科學院重點研究項目的資助。文章已在線發表于https://bmcpsychiatry.biomedcentral.com/articles/10.1186/s12888-019-2300-7

　　(Jingying Wang, Lei Zhang, Tianli Liu, Wei Pan, Bin Hu, Tingshao Zhu. (2019) Acoustic differences between healthy and depressed people: a cross-situation study. BMC Psychiatry, 2019 19:300. DOI: 10.1186/s12888-019-2300-7.)

附件下載：

心理所研究發現通過無監督遷移學習提升精神分裂癥患者基于腦功能影像數據機器學習分類的跨中心泛化性

心理所研究揭示創傷暴露青少年心理問題之間的關聯特征