AI解夢靠譜嗎？學界目前進展如何？

文 | 追問nextquestion

“莊周夢胡蝶，胡蝶為莊周。”縱觀東西方曆史，人類對夢境有着不約而同的執念。夢境也是神秘學的重要部分，常常與預知未來、認識自己等概念聯系在一起。時至今日，人類一直試圖解開夢境背後的意義，經常求助于各種解釋方法，甚至發展出了許多流派。

的确，夢境提供了對我們潛意識深處的一瞥，揭示了隐藏的欲望、恐懼和情緒，對我們的現實生活也不無影響。随着大模型等技術的興起，在GPT store等平台上，也出現了聲稱能夠通過對話解析夢境的AI助手。

▷圖1. 基于大模型的夢境解析網站：https://dreamybot.com

與民間占蔔解夢不同，腦科學與夢境的相關研究首先關注的是夢境的内容，例如夢裡看到的圖像、聽到的聲音，之後才是夢境的意義。其研究對象也并非單個人的自述（轶事），而是一群人叙述的彙總及其中的統計規律。伴随技術進步，研究方法還包括了使用功能性磁共振成像（fMRI）等腦電檢測，依據客觀記錄而不是主觀描述來解析夢境。本文将從科學研究現狀到商業應用前景，概述人們在“如何用AI作為工具指導人們更好地了解做夢”這件小事上做出的努力。

基于個人自述的夢境彙總，男生女生的夢有差別嗎？

夢境的内容可歸因于大腦對白天收集的資訊的處理和整合，這便是美國心理學家卡爾文·霍爾（Calvin Hall）提出的延續假設（continuity hypothesis）。當我們睡眠時，我們的大腦通常會從之前的記憶、經曆和情感中提取片段并拼貼成一個故事。這些神經活動的複雜互相作用産生了我們在夢中遇到的生動的、有時令人費解的場景和人物。

人的大腦就像一個專長蒙太奇的導演，它采用日常經曆中看似無關的事件、人物和物體，并以隻有潛意識才能了解的方式将它們組合在一起。在夢裡，實體和邏輯定律被扭曲，産生了脫離現實引力的奇幻景象和意識流情節，讓我們常常在第二天醒來後反複琢磨前一晚夢境的深意。

然而科學研究畢竟不是奇聞怪談的收集，不論哪個學科，科研的第一步是建立基線，也就是了解大多數人的典型狀況，以便在後續嘗試了解個案時，能夠有一個合适的錨點。2020年的一篇發表在皇家協會開放科學（Royal Society Open Science）的期刊上的研究[1]，通過自然語言處理，分析了不同年齡和性别的24000個被試自述的夢境，建構了資料庫Dream Bank。研究發現，年齡，性别，過往經曆（如是否當過兵）等不同因素都會對被試者的夢境産生影響（圖2）。該研究基于是美國收集的資料，由于各國文化風俗上的差異，該研究的結論不适用于國内，但其研究思路是可以借鑒的。

▷圖2.不同年齡的夢境報告中攻擊性的等級從20世紀60年代到現在在逐漸減少，這個趨勢和美國的暴力犯罪統計資料相符。圖源：參考文獻[1]

除了統計性的群體描述，這類研究還讓人們可以比較和自己處境相似的人會做什麼樣的夢。例如在dreamcatcher中，人們可以根據自身身份檢視下圖中的每一個葉子（點選後對應一個夢的描述），通過了解與自身處境相似的人做了什麼夢，進而緩解因夢境引發的焦慮，也可以上傳自身的夢境描述，豐富資料庫的内容。

▷圖3.基于自然語言處理的夢境解析和彙總網站dreamcatcher：https://social-dynamics.net/dreams/

基于Dream Bank資料庫的衍生研究[2]，還包括通過GPT模型分析夢境自述文本的困惑度（Preplexity，一個衡量文本意外程度的統計量）。以維基百科的文本作為基線，研究表明夢境中的文本并非人們之前預計的那樣格外不可預測，兩者困惑度接近。該研究的另一個發現也符合常識，即女性對夢的描述文本困惑度更高，組間差異更大，這意味着相比女性，男性的夢更容易預測。

▷圖4.男性和女性夢境自述文本的困惑度對比，圖源：參考文獻[2]

科學家是如何讀心的？

與上述依賴主觀自述的研究不同，夢境可視化試圖将人腦在潛意識或無意識狀态下的内在認知活動轉化為顯性的圖像或标簽，例如做夢時看到了什麼，聽到了什麼，有什麼樣的情感。這其中的研究，包括研究者要一次次的将被試從睡眠時喚醒，詢問夢到了什麼的實驗，用以考察人們清醒後對夢的回憶。在這之中，又以清醒夢最為熱門。所謂的“清醒夢”，可看成夢境與清醒的疊加态：做夢者有“正在做夢”的意識，并能描述出自己在做的夢。

夢境可視化的基礎，首先是需要證明經由核磁共振成像，近紅外線光譜儀及腦電圖（EEG）等方法測量得到的大腦的血流，腦電及因工作而發熱的變化模式，可被用以預測腦中的所思所想。19年的研究[3]根據人腦活動，複現了被試觀察的影像。而23年的研究[4]，基于Stable Diffusion，能夠更準确地再現被試者腦中所看的畫面。

對比圖5和圖6，可以顯著的看到重塑的圖像更加準确了，那這性能進步的背後，是有哪些創新促成的？

▷圖5.基于腦電MRI記錄，實用深度神經網絡重制被試觀察到的圖像。圖源：參考文獻[3]

▷圖6.被試者看到的真實圖檔（第一行）和模型重構的圖檔對比。圖源：參考文獻[4]

對比2019年的研究與2023年的研究，最直覺的差別在于2023年的研究增加了語義解碼部分。不過在談及這一點之前，先看看23年研究的圖像解碼是怎麼做的。在大腦處理圖像的過程中，像經過有損壓縮後再放大的圖檔一樣進行操作，腦中圖像會先被壓縮成基本的素描形式，保留關鍵資訊，同時形式更簡潔，便于管理。這些壓縮後的資訊在大腦中是分布式存儲的，這為科學家提供了解碼的可能性。通過fMRI技術，科學家可以記錄大腦活躍的部分，類似于觀察一個擁有數萬塊硬碟的超級電腦處理特定資料時哪些硬碟處于工作狀态，進而建立起一個基本的模型。

在解碼大腦的實際操作中，基于fMRI資料，研究者首先根據大腦的資訊壓縮和分布式處理特點，建構了一個類似簡筆畫的初步圖像。随後，在擴散過程中，模型會像繪畫時一樣逐漸渲染上色，讓圖像逐漸豐富起來。然而，正如繪畫時需要明确所畫目标，重構大腦中想象的圖像也需要利用大腦在觀看圖像後産生的語義資訊，即大腦對圖像的描述。

▷圖7.研究5的模型架構示意圖。圖源：參考文獻[4]

根據大腦的“語義地圖”[5]，被試在聽到某些詞彙時，相關的fMRI資料顯示這些詞彙在大腦周圍分布，而沒有一個明确的語言處理區域。與此同時，與意義相關的詞彙在大腦中的分布更為集中。而研究[4]，則将語義信号和視覺信号分别用不同的神經網絡去處理，進而用解碼的語義資訊來幫助圖像重建。

例如，當被試者看到的是一個狗的圖畫，但隻基于視覺信号，重建的圖像可能會缺少狗的典型特征，使得重建圖像看起來更像是貓；而有了語義資訊的幫助，解碼系統發現觀察到的詞彙和骨頭接近，于是在潛在擴散過程豐富簡筆畫的時候，就會選擇突出那些狗的特征。這種結合了兩種模型的圖像重建方法，比單一依賴語義或視覺資訊的方法，能夠實作更清晰、更準确的圖像還原。

▷圖8. 由985個詞構成的大腦語義地圖。圖源：參考文獻[5]

▷圖9. 對比被試看到的原圖，以及隻基于圖像特征（第二列），隻基于語義特征（第三列）以及基于兩者（第四列）的效果圖。圖源：參考文獻[4]

近年來，科學家通過類似的思路，可以基于腦電資料生成被試聽到的聲音信号[6]，進而讓失語者可以說出自己腦中所想的話。此外，目前還有研究能通過腦電信号解讀出被試者默念的文本[7]，并重建被試觀看的短視訊内的場景[8]。所有這些研究，都說明了研究者目前有能力根據大腦活動讀心。

但這距離解夢還有很長的距離。原因首先是夢境大多是迷幻的，跳躍的，人們會懷疑對夢境的描述更加沒有邏輯，充滿了離奇的意外（前述的基于夢境描述文本困惑度的[2]，已提供了相反的證據）；第二個原因，則在于很多夢境中包含了強烈的情緒，人們會擔心夢境中強烈的情緒可能幹擾其解讀。

對此，24年的一項研究[9]聲稱可以結合個人叙事和fMRI，以此開發預測自發思維情感内容的模型，進而判斷清醒夢中的主觀體驗是積極還是消極的。該預測模型不僅在閱讀故事時能夠預測被試的自我相關性和情感體驗，同樣适用于在自發思維（清醒夢）或休息狀态下的199名參與者。

在這一研究中，研究人員監測參與者閱讀故事時大腦活動，旨在解碼思維的情感次元。為了捕捉各種思維模式，參與者參與了一對一訪談，以制作反映他們過去經曆和情感的個性化叙事刺激。當參與者閱讀他們的故事時，其大腦活動在MRI掃描器内被記錄。在fMRI掃描後，參與者再次閱讀故事，并報告每個時刻感覺到的自我相關性（即這些内容與他們的相關程度）和情感（即這些内容是積極還是消極）。使用每個參與者的自我相關性和情感評分的五分位數，研究團隊建立了25個不同的情感和自我相關性組合，使用機器學習技術結合這些資料及49名參與者的fMRI資料來實時解碼思維的情感次元。

研究發現前扣帶回皮層和島葉前部等關鍵大腦區域在預測個人相關性和情感調子方面至關重要。通過解碼與具體情節無關的情感，該研究有助于我們了解影響主觀體驗的内部狀态和背景，可能有助于揭示思維和情感方面的個體差異，并有助于評估心理健康。

夢境可視化的現實與理想

前述的研究都還沒有直接涉及對做夢時大腦的解析，隻是試圖對清醒狀态（或清醒夢）下受試者的所思所見進行預測。然而，有研究開始直接探索夢境中大腦的活動，并嘗試将夢中的圖像可視化。

例如，研究[10]依據兩名受試者在fMRI下的大腦活動資料和他們自述的夢境内容，揭示了大腦在夢境中的圖像處理具有階層化特點，即做夢時會激活與夢到物體相關的分層視覺特征表征。研究表明，從自做夢時大腦活動中解碼的特征值與夢中物體類别相關的特征值，在在中間到進階深度神經網絡中表現出正相關。這不僅提高了區分夢中物體類别的準确性，而且表明夢境中的視覺特征表征與清醒時的視覺處理相似，意味着大腦在做夢時可能和清醒時使用相同的機制，這支援了通用解碼方法在不同視覺體驗（清醒和夢境）中的泛化能力，進而論證了夢境解析的可行性。

▷圖10.單次實驗中，針對夢境在出現圖檔的預測，可基于較高抽象層級的特征得出。圖源：參考文獻[10]

早在2013年，研究[11]在視覺皮層區域刺激誘導的腦活動上訓練的解碼模型，顯示出模型對夢境内容的分類能力超過随機猜測。在這項研究中，三名受試者在進行磁共振睡眠實驗時，每當腦電信号被檢測到，他們便被喚醒，并描述醒來前的視覺體驗。為了收集充分的資料，每位受試者平均每5-6分鐘就被喚醒一次，主要關注人們剛入睡階段産生的類夢境視覺感受。在超過75%的喚醒中，受試者報告了夢中的内容。預測模型試圖區分受試者夢見的是人還是椅子等物體，并在解碼器的輸出中使用了多個标簽來提升準确性。這距離上文所講的解碼夢境中的所思所想，還相距甚遠。

21年來自清華大學未來實驗室的研究[12]，基于11名被試者REM睡眠期的EEG資料，結合心理問卷幫助評估情緒，最終生成了夢境的抽象視覺表述。圖11展示了基于EEG産生的對夢境的藝術化展示，該例中夢境的情感關鍵詞是如釋重負（relieved）。這項研究進一步說明了目前對夢境的解讀，還遠遠做不到“像素級”的準确度，隻是能夠對情感進行定性的含糊描述，或者對夢境中出現的物體生成有一個比随機更準确的有根據猜測。

▷圖11.基于EEG資料對夢境中的情感産生的藝術化表征。圖源：參考文獻[12]

然而，前文關于清醒時大腦解析的研究，以及夢境和大腦遵循相同神經機制的研究，共同說明了夢境解析具有技術可行性，隻是目前受限于目前研究條件（例如fMRI的機器噪音，實驗成本，受試者過少等技術因素）還不夠成熟。未來随着技術的進步，有着巨大的潛力。且夢境可視化這項技術在心理健康領域的應用具有重要意義。對夢境的了解可能帶來新的治療方法，特别是創傷後應激障礙（PTSD）、抑郁症和焦慮症等疾病。

除了心理幹預，對夢境的重制還可以用于創意生成。應用創意設計等方式對夢境中的内容進行重構，可以産生更有藝術創造力的内容。此外，在科學史中，凱庫勒在夢中找到了苯環的結構，門捷列夫在夢中産生了元素周期表的概念，我們不知道有多少科學上的創意，出現又無聲的消失在夢中，通過對夢境的記錄和解讀，我們未來也許能夠撿起更多這樣帶有科學創新點的夢。

總的來說，EEG和fMRI已經将夢境分析從純粹的猜測轉變為實證科學探索，進而得以讓我們更加接近揭示夢境的真相的那一天。

夢境解析和引導的商業應用

說起解夢，人們最熟悉的是弗洛伊德-榮格的精神分析學派。雖然這一派的理論廣為人知，但學術界對其有效性存在争議。随着大模型及對應智能體的成熟，市面上出現了不少号稱可以解夢的聊天機器人，但這樣的機器人帶給筆者的個人體驗并沒有多麼驚豔。更有一些解夢的應用，宣稱結合中醫典籍，對于這樣有“僞科學”嫌疑的研究，讀者更應該批判性地審視，不能因為大模型的套皮而輕信。

除了就夢境内容展開對話，基于夢境和AI結合還可以考慮夢境記錄方面的應用。考慮到我們對夢境的記錄往往出現在剛睡醒或半睡半醒間，并且很大比例的夢境會在我們醒來後消失，一個記錄工具顯得尤為重要。蘋果平台的PlotPilot[13]可記錄使用者對夢境的語音描述，并通過AI文本分析配上屬于對應的背景音樂，制作成專屬的有聲書（現在可以根據夢境描述産生視訊）。這樣的工具不僅能幫助使用者更好地了解自身潛意識的心理需求，還可以促進對夢境的研究。

如果說根據腦電活動預測個人的所思所想，會讓人想到許多科幻小說裡的場景，那麼能幫助使用者進入且穩定在清醒夢中的工具，則充滿了《盜夢空間》的意味。2024年1月，美國初創公司“Prophetic”開發了一款名為“Morpheus-1”的新型人工智能模型，該模型可以以大腦的腦電活動作為提示詞，基于多模态大模型生成與該大腦狀态互相作用的形狀聲波。據稱，輸出的聲波可與Prophetic計劃明年春季釋出的一款新頭帶産品“The Halo”綁定。The Halo會發送聲波進入大腦，與目前的大腦狀态相連接配接，進而使心靈進入清醒狀态。據Prophetic稱：“引導産生的清醒夢是一種夢者意識到自己正在睡覺的夢。”而公司設想的産品則可以讓使用者有效控制自己的夢境。

由于該公司成立不久，宣傳的産品還沒有釋出，其技術的實際能力還有待進一步觀察。一旦成功，此舉對學界和市場都有重要的意義，引導清醒夢将有助于減少PTSD等心理疾病引發的噩夢，促進正念，為意識的神秘本質打開新的視窗。

另一方面，無論是引導還是預測夢境，這些涉及個人私人體驗的應用無疑将産生大量敏感的資料。如何避免這樣的技術被濫用？消費者需要提前意識到技術的雙刃劍性質，有保護自身的權利和隐私的意識。在技術成熟前，不妨先通過科幻小說進行思想實驗，模拟各種情況下新技術産品的推動可能對社會造成的影響：例如，如果未來的打勞工要通過清醒夢來證明自己對企業的忠誠，多疑的伴侶可以偷偷記錄并解析枕邊人的夢境以查找出軌的證據時，社會又将成為什麼樣？

小結

“Life is but a dream···”

從弗洛伊德和榮格的心理學，到最新的基于腦電的讀心術，以及基于大模型的海量夢境自述的文本分析，我們對大腦的了解，正在從定性轉為定量，從個體案例轉為群體統計，從依賴主觀描述轉為客觀資料。随着對夢境産生機制的了解，人們也能夠逐漸去控制夢的産生，進而避免或減少噩夢的出現，甚至引導清醒夢的産生。

同時，随着人們對夢境的測量和控制手段的進步，研究者得以用科學地方式去嘗試回答更多之前無法解答的問題，如夢境中的情感體驗究竟是什麼樣的？動物們在做夢時在想到了什麼場景？AI是否具有做夢的能力？知識帶來新的技術應用，而新技術擴充了可觸及知識的邊界。對夢境的研究，一旦脫離了民科和僞科學，就将踏上科學界通用的正向飛輪。

參考資料：

[1] Fogli, Alessandro, et al. “Our Dreams, Our Selves: Automatic Analysis of Dream Reports.” Royal Society Open Science, vol. 7, no. 8, 26 Aug. 2020, https://doi.org/10.1098/rsos.192080.‌
[2] Bertolini, Lorenzo. Dreams Are More “Predictable” than You Think.‌
[3] Shen, Guohua, et al. “Deep Image Reconstruction from Human Brain Activity.” PLOS Computational Biology, vol. 15, no. 1, 14 Jan. 2019, p. e1006633, https://doi.org/10.1371/journal.pcbi.1006633.‌
[4] Takagi, Yu, and Shinji Nishimoto. High-Resolution Image Reconstruction with Latent Diffusion Models from Human Brain Activity.‌
[5] Huth, A.G., de Heer, W.A., Griffiths, T.L., Theunissen, F.E., Gallant, J.L., 2016. Natural speech reveals the semantic maps that tile human cerebral cortex. Nature 532, 453–458. doi:10.1038/nature17637
[6] Chen, Xupeng, et al. “A Neural Speech Decoding Framework Leveraging Deep Learning and Speech Synthesis.” Nature Machine Intelligence, vol. 6, no. 4, 1 Apr. 2024, pp. 467–480, https://doi.org/10.1038/s42256-024-00824-8.
[7] Duan, Yiqun, et al. DeWave: Discrete EEG Waves Encoding for Brain Dynamics to Text Translation.
[8] Chen, Zijiao, et al. Cinematic Mindscapes: High-Quality Video Reconstruction from Brain Activity.
[9] Hong Ji Kim, et al. “Brain Decoding of Spontaneous Thought: Predictive Modeling of Self-Relevance and Valence Using Personal Narratives.” Proceedings of the National Academy of Sciences of the United States of America, vol. 121, no. 14, 28 Mar. 2024, https://doi.org/10.1073/pnas.2401959121. ‌
[10] Horikawa, Tomoyasu, and Yukiyasu Kamitani. “Hierarchical Neural Representation of Dreamed Objects Revealed by Brain Decoding with Deep Neural Network Features.” Frontiers in Computational Neuroscience, vol. 11, 31 Jan. 2017, www.frontiersin.org/articles/10.3389/fncom.2017.00004/full, https://doi.org/10.3389/fncom.2017.00004. Accessed 26 Nov. 2019.
‌[11] Horikawa, T., et al. “Neural Decoding of Visual Imagery during Sleep.” Science, vol. 340, no. 6132, 4 Apr. 2013, pp. 639–642, science.sciencemag.org/content/340/6132/639.full, https://doi.org/10.1126/science.1234330.
[12] Chen, Yunbing, et al. EEG Based Artistic Visualization of Dreams. 16 Oct. 2021, https://doi.org/10.1145/3490355.3490376. Accessed 4 Oct. 2023.‌
[13] https://medium.com/@plotpilot/how-people-are-re-experiencing-last-nights-dreams-with-generative-ai-4e5a136d63b6