看不見的數字化工人。 神譯局是36氪旗下編譯團隊,關注科技、商業、職場、生活等領域,重點介紹國外的新技術、新觀點、新風向。 編者注:AI史的敘述方式往往是機器隨時間轉移而變得越來越聰明。但這種敘述缺少了人的要素,沒有講清楚智能機器是如何由人的身體和思想來設計、訓練與賦能的。 為此,IEEE推出了總共六篇的AI秘史系列文章,希望從創新者、思想家、工人甚至小販等人如何創造可復制人類思想和行為的算法的角度來彌補這一缺失。盡管無需人類輸入的超智計算機令人興奮,但智能機器的真正歷史已經證明,AI的水平只能跟我們一樣的好。此文為系列的第六篇,作者是 Oscar Schwartz,原文標題為:Untold History of AI: How Amazon’s Mechanical Turkers Got Squeezed Inside the Machine
第六部分:土耳其機器人修訂版 千禧之交,Amazon開始將服務擴展到賣書以外的領域。隨著網站的產品款式不斷豐富,公司必須想出新的辦法對其進行分類組織。其中的一部分任務是將網站上出現的成千上萬重復產品撤除掉。 公司的工程師試圖寫軟件自動消除重復出現的產品。識別并刪除對象看似簡單的任務,這應該在機器的能力范圍內。但工程師很快就放棄了,稱其中的數據處理挑戰是“難以克服的”。這項任務要求具備識別圖片和文字之間存在細微差別和相似性,其實需要的是人的智能。 這個難題留給了Amazon。刪除網站上的重復產品對人來說是一項瑣碎的工作,但重復產品的絕對規模需要大量勞動力。一項任務要協調如此眾多的工人就不是一項瑣碎的工作量。 Amazon一位叫做Venky
Harinarayan的經理想出了一個解決方案。他的專利描述了一個“人機混合的計算部署”,也就是將任務分解成小單位,或者“子任務”,然后分配給一個工人網絡。 Amazon一位經理的專利描述了一個“人機混合的計算部署” 刪除重復項的情況下,中心的計算機可以將Amazon的網站分割成一塊塊——比方說,100個開罐器的產品頁,然后通過互聯網將這部分網頁發給處理的工人。工人然后識別這些網頁當中的重復項,再把處理過的返回去。 這種分配系統提供了一個關鍵優勢:工人不需要集中在一個地方,而是隨時隨地在自己的個人計算機上完成子任務?;旧?,Harinaryran開發的是一個將地技能但又難以自動化的工作分配給一個可并行工作的工人網絡的有效手段。 在Amazon的內部運作證明,這個辦法非常有效,以至于貝索斯決定這個系統可以作為服務賣給其他公司。貝索斯將Harinaryan的技術變成了一個勞動力市場。企業在這個市場內可以將人容易做(但很難自動化)的任務跟自由職業工人組成的網絡漸進性匹配,給很少一點錢就可以讓他們完成任務。 Amazon Mechanical Turk(或者簡稱Turk)就是這么誕生的。這項服務于2005年推出,然后用戶群迅速擴大。全球的企業和研究人員開始上傳成千上萬所謂的“人類智能任務”到平臺上,比如音頻轉錄或者給圖像加標題等。然后這些任務由一支國際化的匿名工人群體以很少的費用(有一位憤憤不平的工人報告稱平均每項任務的費用只有20美分)忠實地執行。 這項新服務的名字是向18實際那臺下棋機器(參見AI秘史一),販子Wolfgang von
Kempelen發明的土耳其機器人的致敬。就像那個騙人的自動化(機器內部藏有一個人類棋手)一樣,mTurk平臺也是為了讓人類工人不可見。平臺的工人不提供名字,只有數字,而且請求者與工人之間的溝通完全是去個性化的。貝索斯本人把這些去個性化的工人稱為是“人工的人工智能”。 2017年的一篇論文發現,在平臺上的工人時薪中位數大概是2美元,只有4%能拿到7.25美元以上。 今天,mTurk是一個繁榮的市場,上面有來自全球的數十萬工人。盡管該在線平臺為本來沒機會得到工作的人提供了一個收入來源,但其勞動條件是很有問題的。一些人認為,通過將工人隱藏起來并且原子化,Amazon可以更容易地盤剝他們。2017年的一篇論文發現,在平臺上的工人時薪中位數大概是2美元,只有4%能拿到7.25美元以上。 有趣的是,mTurk也成為了機器學習應用開發的關鍵。在機器學習中,AI程序被賦予了一個很龐大的數據集,然后再自行尋找模式并得出結論。mTurk的工人被頻繁用于建立這些訓練數據集并打上標簽,但他們在機器學習中的角色往往被忽視。 AI社區與mTurk之間進行的那些事兒是貫穿整個機器智能史的動態之一。我們熱切地贊美自動化“智能機器”的表象,卻又忽視,或者甚至主動隱瞞使之變得可能的人類工作。 也許我們可以從作家埃德加·愛倫·坡那里吸取一些經驗。當他看了von Kempelen的土耳其機器人之后,他并沒有被幻象迷惑。相反,他在想如果棋手被困在里面的話會怎樣,躲起來的那個人被齒輪和連桿“擠得扁扁的,處于極其痛苦又尷尬的位置。” 在當下,當關于AI突破的新聞頭條充斥于我們的新聞流時,記住愛倫坡的取證態度很重要。被卷入到AI的炒作當中是令人愉快的,如果說有時候會令人擔憂的話,而不需要凡夫俗子的機器這一愿景也令人著迷。但如果你再仔細看看的話,很可能會看到人類勞動的蛛絲馬跡。 譯者:boxi 本文翻譯自 https://spectrum.ieee.org/tech-talk/tech-history/dawn-of-electronics/untold-history-of-ai-mechanical-turk-revisited-tktkt,原文鏈接。如若轉載請注明出處。 |