您當(dāng)前的位置:首頁 > 輿情 > 網(wǎng)言網(wǎng)語
“暗黑版”AI現(xiàn)身引憂慮 我們需要怎樣的人工智能?
智能穿戴設(shè)備吸引觀眾。湯彥俊 攝
近日,麻省理工學(xué)院媒體實驗室出品了一個“暗黑版AI”,再次將人工智能的黑箱隱憂這個經(jīng)久不衰的話題送上熱門。據(jù)報道,實驗室的三人團隊聯(lián)手創(chuàng)造了一個叫諾曼(Norman)的人工智能,與希區(qū)柯克經(jīng)典電影《驚魂記》中的變態(tài)旅館老板諾曼·貝茲同名。
名如其人。諾曼會以負面想法來理解它看到的圖片。例如,一張在一般AI看來只是“樹枝上的一群鳥”的普通圖片,在諾曼眼中卻是“一名男子觸電致死”。
團隊希望通過諾曼的表現(xiàn)提醒世人:用來教導(dǎo)或訓(xùn)練機器學(xué)習(xí)算法的數(shù)據(jù),會對AI的行為造成顯著影響。AI會成為什么樣,有時人類可能束手無策。
TA們的偏見就是人類的偏見
諾曼們從哪來?答案首先藏在數(shù)據(jù)里。
“人工智能識別出的結(jié)果不是憑空而來,是大量訓(xùn)練的結(jié)果。如果要訓(xùn)練AI某一方面的能力,比如下棋,就需要收集、清洗、標(biāo)記大量數(shù)據(jù)供機器學(xué)習(xí)。如果用于訓(xùn)練的數(shù)據(jù)不夠多,就會造成AI學(xué)習(xí)的不充分,導(dǎo)致其識別結(jié)果的失誤。”中科院自動化研究所研究員王金橋?qū)萍既請笥浾弑硎。?shù)據(jù)本身的分布特性,如偏差甚至偏見,也會被機器“有樣學(xué)樣”。針對諾曼的表現(xiàn),創(chuàng)造它的實驗室也指出,“當(dāng)人們談?wù)撊斯ぶ悄芩惴ù嬖谄詈筒还綍r,罪魁禍首往往不是算法本身,而是帶有偏差、偏見的數(shù)據(jù)。因為當(dāng)前的深度學(xué)習(xí)方法依賴大量的訓(xùn)練樣本,網(wǎng)絡(luò)識別的特性是由樣本本身的特性所決定。盡管在訓(xùn)練模型時使用同樣的方法,但使用了錯誤或正確的數(shù)據(jù)集,就會在圖像中看到非常不一樣的東西”。
另外是算法本身的影響。“這可能是無法完全避免的,由深度學(xué)習(xí)算法本身的缺陷決定,它存在內(nèi)在對抗性。”王金橋表示,目前最流行的神經(jīng)網(wǎng)絡(luò)不同于人腦的生物計算,模型由數(shù)據(jù)驅(qū)動,和人類的認知不具有一致性;谏疃葘W(xué)習(xí)的框架,必須通過當(dāng)前訓(xùn)練數(shù)據(jù)擬合到目標(biāo)函數(shù)。在這個框架之下,如果機器要識別狗,它會通過狗的眼睛、鼻子、耳朵等局部特征進行可視化識別,而這些可視化特征卻能給想利用深度學(xué)習(xí)漏洞的人機會,后者可以通過偽造數(shù)據(jù)來欺騙機器。
除了人訓(xùn)練機器的數(shù)據(jù)本身有偏差以外,機器通過對抗性神經(jīng)網(wǎng)絡(luò)合成的數(shù)據(jù)也可能有問題。由于機器不可能“見過”所有東西(比如識別桌子,機器不可能學(xué)習(xí)所有長短寬窄各異的桌子),人也不可能標(biāo)記所有數(shù)據(jù)。如果研究者輸入一個隨機的噪音,機器可以向任何方向?qū)W習(xí)。這是一把雙刃劍,機器也可能合成一些有問題的數(shù)據(jù),學(xué)習(xí)時間長了,機器就“跑偏”了。
數(shù)據(jù)的均衡或可減少“跑偏”
不少科學(xué)家以“garbage in, garbage out”來形容“數(shù)據(jù)和人工智能的關(guān)系”。中科視拓(北京)科技有限公司CEO劉昕說:“對機器學(xué)習(xí)而言,進什么就出什么。監(jiān)督學(xué)習(xí)就是讓模型擬合標(biāo)簽,比如訓(xùn)練者把帥哥都標(biāo)記成‘渣男’,那么機器看到劉德華,就會認為他是……”談到諾曼引發(fā)的討論,劉昕表示:“不需要擔(dān)心,人類本身就有各種歧視和偏見,用人類生產(chǎn)的數(shù)據(jù)訓(xùn)練AI,再批判AI不夠正直良善,這么說有點危言聳聽。”
偏見、刻板印象、歧視都是人類社會的痼疾,有些流于表面,有些深入社會肌理,無法輕易剝離。在這樣的語境中產(chǎn)生的數(shù)據(jù),攜帶著大量復(fù)雜、難以界定、泥沙俱下的觀點。如果研究者沒有意識到或著手處理這一問題,機器學(xué)習(xí)的偏見幾乎無解。真正的“公正算法”或許是不存在的。
據(jù)有關(guān)媒體報道,在谷歌研究自然語言處理的科學(xué)家 Daphne Luong 表示,正確地校準標(biāo)簽對機器學(xué)習(xí)來說非常關(guān)鍵,有些數(shù)據(jù)集其實并不平衡,像維基百科上的數(shù)據(jù),“他”(He)出現(xiàn)的次數(shù)遠比“她”(She)要多。
王金橋也著重強調(diào)了“數(shù)據(jù)的均衡”。就算對人來說,不同人秉持著不同的價值觀,但多聽多看多受教育可以讓人向良好的方向改進。機器學(xué)習(xí)也是如此。“訓(xùn)練機器時,要注重數(shù)據(jù)的均衡,給它更多可靠的數(shù)據(jù)。研究團隊成員具有多元的學(xué)術(shù)背景(如吸納更多社會學(xué)、心理學(xué)等領(lǐng)域?qū)W者加入)、性別、年齡、價值觀,也可以幫助機器學(xué)習(xí)更加均衡,減少機器出現(xiàn)偏見、謬誤甚至失控的可能。”王金橋說。
“機器學(xué)習(xí)的模型本身也要有一定的防攻擊能力,從技術(shù)上防止本身結(jié)構(gòu)設(shè)計的漏洞被攻擊,研究者可以使用各種數(shù)據(jù)攻擊機器,訓(xùn)練機器的反攻擊能力。”王金橋說。
作惡還是向善,是人類的選擇
責(zé)任編輯:wuyong
1、凡本網(wǎng)注明“來源:互聯(lián)網(wǎng)輿情忻州” 的所有作品,版權(quán)均屬于互聯(lián)網(wǎng)輿情忻州(本網(wǎng)另有聲明的除外);未經(jīng)本網(wǎng)授權(quán),任何單位及個人不得轉(zhuǎn)載、摘編或以其它方式使用上述作品;已經(jīng)與本網(wǎng)簽署相關(guān)授權(quán)使用協(xié)議的單位及個人,應(yīng)注意該等作品中是否有相應(yīng)的授權(quán)使用限制聲明,不得違反該等限制聲明,且在授權(quán)范圍內(nèi)使用時應(yīng)注明“來源:互聯(lián)網(wǎng)輿情忻州”。違反前述聲明者,本網(wǎng)將追究其相關(guān)法律責(zé)任。
2、凡本網(wǎng)注明 “來源:XXX(非互聯(lián)網(wǎng)輿情忻州)” 的作品,均轉(zhuǎn)載自其它媒體,轉(zhuǎn)載目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點和對其真實性負責(zé)。
3、如因作品內(nèi)容、版權(quán)和其它問題需要同本網(wǎng)聯(lián)系的,請在30日內(nèi)進行。
※ 網(wǎng)站聯(lián)系電話:18295883981 郵箱:hlwyqxz@163.com
- 網(wǎng)言網(wǎng)語丨振奮龍馬精神 鉚足勁頭加油干
- 網(wǎng)言網(wǎng)語丨追思懷遠 汲取奮進力量
- 網(wǎng)言網(wǎng)語摘錄:2024經(jīng)典新詞
- 網(wǎng)言網(wǎng)語|十大網(wǎng)絡(luò)熱詞 看看有你常用的嗎?
- 2023年十大流行語 讓我們看到了什么?
- 網(wǎng)絡(luò)案件中專業(yè)的“網(wǎng)言網(wǎng)語”你可明白?
- 互聯(lián)網(wǎng)輿情今日分享:網(wǎng)言網(wǎng)語微語錄
- 網(wǎng)言網(wǎng)語豈可成為流言蜚語
- 話糙理不糙的網(wǎng)絡(luò)名言
- 網(wǎng)絡(luò)名言經(jīng)典語錄大全