過兩天會上線一個(gè)關于AI模型性别歧視查詢的(de)網站。先預熱(rè)一下(xià),來(lái)介紹一下(xià)另一個(gè)我們剛剛放上網的(de)關于AI性别歧視的(de)研究
今天講的(de)是:挽救失足AI,不能光(guāng)靠打罵。
AI會重男(nán)輕女(nǚ)、愛(ài)白欺黑(hēi)。這(zhè)是好多(duō)文獻已經發現的(de),好多(duō)研究也(yě)已經開始琢磨怎麽抽打AI,讓它們不要跟著(zhe)人(rén)類學壞
但是,現在的(de)很多(duō)方法都有個(gè)問題:你糾正AI性别歧視,就會讓它變笨:它要麽就分(fēn)不清爸(bà)爸(bà)媽媽的(de)男(nán)女(nǚ)、要麽就會語法錯誤——比如第三人(rén)稱後的(de)動詞就不會加s了(le)。
問題出在了(le)現在的(de)糾正AI歧視的(de)方法——現在的(de)方法通(tōng)俗的(de)講,就是純打罵:隻要你搞性别歧視,我就抽你。用(yòng)皮鞭抽你你不改,我就改鋼鞭;效果還(hái)不好的(de)話(huà),就上帶刺的(de)鋼鞭。
所以,一個(gè)問題是:挽救失足AI,那AI就一定變蠢麽?
我們的(de)這(zhè)個(gè)研究說:如果我們用(yòng)計量經濟學的(de)觀點看,不是!
我們證明(míng)了(le):打罵AI要不得(de)~你靠打罵AI糾正歧視,AI就會變笨
就像你教育孩子不能光(guāng)靠打罵、得(de)理(lǐ)解孩子怎麽想的(de)、然後跟它們講道理(lǐ)一樣;對(duì)AI,你也(yě)得(de)如此。
要耐心理(lǐ)解AI它爲啥會歧視,然後對(duì)症講道理(lǐ),就能夠糾正AI的(de)性别歧視,AI還(hái)不會變笨。