在多數人觀念裡,人工智慧的發展應該只需要工程師在前線技術不斷突進,但事實是,AI 訓練的背後是龐大的勞動力支撐。在自動駕駛的實現過程中,圖片標記就是一項需要密集勞動的浩盪工程。
當別人在翻雜誌或滑 Instagram 時,Shari Forrest 打開手機 App 開始訓練人工智慧。
Forrest 住在聖路易斯城郊,今年 54 歲,她不是工程師,也不是程式設計師,她靠寫教科書謀生。在平時休息的零碎時間裡,她會登錄 Mighty AI,標註行人和垃圾桶,以及其他你不想讓自駕車撞上的東西。「如果我乾坐著等醫生看診的時候,還能賺幾個錢,何樂而不為?」
對 Forrest 來說,這是一個愉快的消遣,而背後的本質是,自動駕駛時代正在到來。
支撐自動駕駛訓練所需的數據量超乎想像。雖然 Google 和通用這些公司很少提及,但他們耀眼的機器和資料中心卻依賴全世界越來越多像 Forrest 這樣的人。
正如你聽到的那樣,如今,幾乎每個人都認為 AI 勢必帶來全面革命。汽車廠商尤其樂意強調這些,因為自駕車將提高安全性,減少塞車,讓生活更便捷。「汽車是機器學習使用熱度最高也是最先進的領域之一,」Mighty AI CEO Matt Bencke 說。雖然沒有點名,但他表示,公司正在合作的汽車廠商至少有 10 家。
如何教機器學會開車是一個很大的挑戰。美國車輛管理局的規則樹立了一個起點,提供一些基礎概念,比如「行人量」。但行人到底是什麼樣子?人一般有兩條腿,不過,對機器來說,穿上裙子後的兩條腿就和一條腿一樣,而且,坐輪椅的人該怎麼辨識?推嬰兒車的呢?前面的障礙物究竟是一個小孩,還是一隻大狗,或一個垃圾桶?
無論如何,搭載人工智慧的汽車必須學會辨認這些,理解這個經常連人類也理解不了的世界。對人來說這是第二本性,但放在車子身上就截然不同了。
Forrest 和其他 20 萬 Mighty AI 用戶
自動駕駛原型車的鏡頭幾乎可以捕捉所有環境和情景下的圖像。廠商和科技公司將數百萬張圖片發給 Mighty AI 這樣的公司做標記,也正是後者促成在照片中辨識萬物的遊戲。聽起來或許很乏味,但 Mighty AI 這類公司正是透過這種 10 分鐘的輕便任務來維持自身運轉。「這更像一個休閒遊戲,而不是體力勞動,」Bencke 說。錢財的獎勵雖然微不足道,卻也發揮一定作用。
Forrest 小心翼翼地在每張圖裡的每個人旁邊畫一個框,然後是每輛在接近的車、每輛車的輪胎。之後,她再將它們放大,逐像素地確認,細緻描繪出樹的輪廓。點擊、點擊、點擊。她會選擇不同顏色的指示器,將交通號誌、電線桿、交通錐調亮。所有步驟完成之後,這個場景就以機器可以理解的語言標註出來了,工程師稱之為「語義分割」。
對準確性的要求決定了這項工作注定是辛苦的,但 Forrest 卻表示很享受這個過程:「就像很多人喜歡塗色一樣,這是一項讓人放鬆的工作。」
這些百萬計的標註圖片可幫助 AI 辨識各類事物,幫助理解諸如人是什麼樣子這類問題。最後,AI 將變得夠聰明,能自行在行人旁畫框。像 Forrest 這樣的工作人員可幫助檢查 AI 的工作。「一段時間以後,AI 會夠聰明,能夠可靠地辨識事物。」Kangaroos 說。
將這些願景寄託到非專業人員身上看起來可能很奇怪,但這仍是訓練 AI 的有效方式。「這很可能是唯一的路徑。」在 USC 資訊科學機構研究機器視覺的 Premkumar Natarajan 說,他在這領域有超過 20 年的經驗。
雖然在這個所謂的無監督學習領域已經有一些研究,電腦可以最小資源投入學習,但眼下人工智慧的智慧程度仍取決於它訓練的資料品質。
Bencke 稱,他的平台還可以使用自己的機器學習,判定 Mighty AI 上每個成員最擅長的東西。並沒有人因為從事這項重要的工作致富,但是對 Forrest 來說,這不是重點。
她說,自己將去年在平台賺到的 300 美元花在網購上。她從來沒見過自動駕駛車,更不要說親自乘坐一輛這樣的車,但意識到自己在幫助這些車變得更聰明,讓她在進行這項工作的時候更相信科技的力量。