科學家使用腦部掃描和人工智能來“解碼”人類思想

  • 美國之音

2019年1月9日,在法國西部佈雷斯特地區和大學醫院中心的屏幕上可以看到由正電子發射斷層掃描掃儀拍攝的人腦圖片。(法新社照片)

科學家週一(5月1日)表示,他們已經找到了一種方法,可以使用腦部掃描和人工智能建模,來翻譯記錄人們正在思考的“要點”,這被描述為邁向讀心術的一步。

Your browser doesn’t support HTML5

科學家使用腦部掃描和人工智能來“解碼”人類思想

雖然語言解碼器的主要目標是幫助那些失去溝通能力的人,但美國科學家承認,這項技術引發了關於“精神隱私”的問題。

為了緩解這種恐懼,他們進行了測試,表明他們的解碼器不能用於任何不允許在功能性磁共振成像(fMRI)掃描儀內長時間訓練大腦活動的人。

先前的研究表明,大腦植入物可以使不能說話或打字的人拼寫單詞甚至句子。

這些“腦機接口”集中在大腦試圖形成單詞時控制嘴巴的部分。

美國德克薩斯大學奧斯汀分校(University of Texas at Austin)的神經科學家亞歷山大·胡斯(Alexander Huth),是一項新研究的共同作者。他說,他的團隊的語言解碼器“在一個非常不同的層面上工作”。

“我們的系統確實在思想、語義和意義等層面上工作,”胡斯在在線新聞發布會上說。

根據《自然神經科學》(Nature Neuroscience)雜誌的研究,這是第一個能夠在沒有侵入性大腦植入物的情況下重建連續語言的系統,

“比語言更深刻”

在這項研究中,三個人在“功能磁共振成像機器”內總共花了16個小時聽口語敘事故事,主要是《紐約時報》(The New York Times)的“現代愛情”等播客。

這使得研究人員能夠繪製出單詞、短語和含義是如何在已知處理語言的大腦區域中引起反應的。

他們將這些數據輸入到使用GPT-1的神經網絡語言模型中,GPT-1是後來應用在非常流行的ChatGPT中的人工智能技術的前身。

該模型經過訓練,可以預測每個人的大腦對感知到的語音的反應,然後縮小選項範圍,直到找到最接近的反應。

為了測試模型的準確性,每個參與者在“功能磁共振成像機器”中聆聽一個新故事。

該研究的第一作者傑裡·唐(Jerry Tang)表示,解碼器可以“恢復用戶聽到的內容的要點”。

例如,當參與者聽到“我還沒有駕照”這句話時,模型得到的是:“她甚至還沒有開始學習開車。”

研究人員承認,解碼器在“我”或“她”等人稱代詞上很費力。

但是他們說,即使參與者想出了自己的故事--或者觀看了無聲電影--解碼器仍然能夠掌握其中的“要點”。

這表明“我們正在解碼比語言更深刻的東西,然後將其轉換為語言,”胡斯說。

由於“功能磁共振成像機器”掃描得太慢,無法捕獲單個的單詞,因此它會收集一個“大雜燴,即幾秒鐘內的信息聚集,”胡斯說。“所以,即使確切的單詞丟失了,我們仍可以看到這個想法是如何演變的。”

倫理警示

西班牙格拉納達大學(Granada University)生物倫理學教授大衛·羅德里格斯-阿里亞斯·韋爾亨(David Rodriguez-Arias Vailhen)沒有參與這項研究,但他說這超出了以前的腦機接口所取得的成就。

他說,這使我們更加接近機器“能夠閱讀心靈和翻譯記錄思想”的未來,他還警告說,這可能會違背人們的意願,例如當人們在睡覺的時候。

研究人員預料到了這種擔憂。

他們進行了測試,表明如果解碼器尚未接受過自己特定大腦活動的訓練,則解碼器對人不起作用。

三名參與者能夠輕鬆地挫敗了解碼器。

在收聽其中一個播客時,用戶被要求數七的倍數,說出或想像一些動物,或在腦海中講述不同的故事。研究人員說,所有這些策略都“破壞”了解碼器。

接下來,該團隊希望加快這一過程,以便他們可以實時解碼大腦掃描。

他們還呼籲制定保護精神隱私的法規。

“到目前為止,我們的思想一直是我們隱私的守護者,”羅德里格斯- 阿里亞斯說。“這一發現可能是未來威脅這種自由的第一步。”

(本文依據了法新社的報導。)