Facebook正在以「我們」的數據去打造全球最佳的人工智慧實驗室!

首圖來源 :huxiu
是時候停止把 Facebook 當作純粹的社群媒體公司來看了。它用無人機提供網路連接服務,為了發展虛擬現實而收購 Oculus ,努力不懈追求人工智慧, Facebook 已經迅速成為世界上最先進的技術研究中心之一了。
無獨有偶, Google 甚至 IBM 之類的公司也有類似的計劃,總的來說,人工智慧領域的發展已經提速到無疑會影響到人機互動的節點了。事實上,這已經發生了,不過是悄悄地在幕後進行。每月為 15 億用戶提供服務的 Facebook 對人工智慧技術興趣濃厚。 Facebook 解決的是模擬一般智力的問題——即讓計算機日漸脫離線性邏輯的機器的思考方式,而是像我們自由形態的人類以多管齊下的方式來思考。 Facebook 人工智慧研究室(FAIR)致力於解決廣義的人工智慧的問題,而語言技術項目組和 Facebook M(虛擬助手)這類規模稍小的項目組則致力於開發用戶操作中會用到的實際功能。
Facebook 人工智慧研究室的誕生
一切始於 2013 年, Facebook 創始人兼 CEO Mark Zuckerberg 、 CTO Mike Schroepfer 和其他公司高層在評估公司上線十年以來的成就,並思考在接下來的十年、二十年如何長盛不衰。
Facebook 已經將機器學習運用到其流行的社群網絡中,比如說決定用戶會在 News Feeds 中看到什麼內容。不過相比起當時的神經網絡成果,這不過是小兒科。
一些 Facebook 工程師也一直在嘗試卷積神經網絡(CNNs),這是一種非常強大的機器學習,現在普遍被用於圖像識別。即便人工智慧還處於發展初期, Zuckerberg 對它的潛力非常看好,因此他從 Google Brain 挖了一位叫做 Marc Aurelio Ranzato 的工程師。然後他追本溯源找到了卷積神經網絡的發明者—— Yann LeCun。
Facebook 人工智慧實驗室負責人 Yann LeCun 是人工智慧界的一個傳奇。他最早在 1988 年在貝爾實驗室擔任研究員(由電話之父 Alexander Graham Bell 創立,並因其在電信技術領域的無數領域的實驗而聞名)開始他的研究,然後在 AT&T 實驗室擔任部門主管直到 2003 年。那之後他開始在紐約大學任教。現代的積神神經網絡是 LeCun 職業生涯的巔峰之作。你是否曾經好奇過 ATM 怎麼能識別你的支票?這就得益於 LeCun 負責的「SN」的神經網路模擬器的早期研究,於 1996 年被採用。
「我開始和 Schroepfer 和 Mark 接洽,我想他們也許喜歡我向他們講述的東西」, LeCun 在接受《Popular Science》採訪中說道:「他們試圖說服我來運作這個實驗室……當像 Mark 那樣的人跑過來和你說:『好吧,你基本上接受了全權委託。你能組建世界一流的研究室,我希望你建立起全世界最好的人工智慧研究實驗室』。我的回答將會是:『嗯,相當有意思的挑戰。』」
關於世界頂級的研究室是什麼樣子, Yann 有自己的想法。如果你想要吸引頂尖人才,你得有一個雄心勃勃的研究室,有著雄心勃勃的長期目標。然後你還得給他們工作上的自由權,同時對你的研究你必須持有非常開放的態度。 「這和 Facebook 的信念有幾分吻合, Facebook 秉持著開放的理念。」 LeCun 說。
組建團隊
這個肩負著 Facebook 的未來的團隊規模很小,由大約 30 個研究科學家和 15 名工程師組成。團隊有三個分支: Facebook 人工智慧研究組的主要辦公室位於紐約市的 Astor Place ,由 LeCun 管理著一個由 20 名工程師和研究人員組成的團隊。 Menlo Park 的是一個同等規模的分支。六月, FAIR 又在巴黎設立了一個更小的 5 人組,與 INRIA(法國計算機科學與自動化研究機構)合作。還有很多在 Facebook 其他部門一起合作致力於人工智慧發展的團隊,例如語言技術團隊; FAIR 只是主要的研究部門。
這些研究人員和工程師來自科技領域的各個層面,同時當中很多人都曾與 Lecun 合作過。高等人工智慧研究並非是一個龐大的領域,而且 Lecun 的很多學生都創建了人工智慧方面的新創公司,它們一般會被像 Twitter 這樣更大的企業收購。
Lecun 曾經告訴《連線》雜誌,「深度學習實際上是 Geofff Hinton ,我,還有蒙特利爾大學的 Yoshua Bengio 之間的一個陰謀。」 Hinton 在 Google 研發人工智慧, Bengio 奔波於蒙特利爾大學和數據挖掘公司 Apstat 之間,而 LeCun 也與其他行業內的著名企業有千絲萬縷的關聯。
「當我第一次在貝爾實驗室做到部門主管時,我的老闆對我說,你需要記住兩點:首先,永遠不要讓自己陷入團隊內部的競爭。第二,只僱傭那些比你更聰明的人,」 LeCun 說。
負責領導語言研究子群的 Leon Bottou ,是 LeCun 的一個老同事。他們一同研發了神經網絡模擬器, 1987 年的 AmigaOS 就是他們的第一個作品。 Bottou 2015 年 3 月加入的 FAIR ,此前他在為微軟研究組工作的同時,還致力於機器學習和機器推理的探索。

(從左數起, Leon Bottou , Yann LeCun , 還有 Rob Fergus,在 Facebook 的紐約辦公室裡工作。)
(image source :huxiu)
2014年11月,LeCun 請來 Vladimir Vapnik 作為他們的團隊顧問。 Vapnik 和 LeCun 曾一起在貝爾實驗室工作,發表了關於機器學習的形成性研究,其中包括一項測量機器學習能力的技術。 Vapnik 是統計學習理論之父,統計學習理論即基於既定數據的預測。預測,對人類來說似乎是一個簡單的任務,實際上卻需要關於預先形成的概念和對世界的觀察巨量訊息(更多是後者)。 Vapnik ,這一領域的先驅,基於他在知識傳播上的興趣,繼續著這一領域的工作,並把師生互動時的線索運用在機器學習當中。
目標
團隊的規模和科研力量允許 Facebook 擁有雄心勃勃的長期目標,絕不會達不到被 LeCun 稱為「明確的智慧」的標準。
「迄今,最好的人工智慧係統也是愚鈍的,因為它們沒有常識。」LeCun 說道。他用一種情況舉例,比如我拿起一個瓶子,然後離開房間。 (我們在紐約 Facebook 的會議室裡討論真正的機器智慧的誕生,而這個房間的名字卻不怎麼吉利—— Gozer the Gozerian,與《魔鬼剋星》裡面的反派同名。)人類的大腦不難想像出一個人拿起瓶子然後離開房間這麼個簡單的場景,但對一台機器來說,僅這個前提就會導致大量的訊息缺失。
Yann 一邊說,我一邊在心中想像這個場景:「你很可能站起來,即使我在語句中沒有提到,你也很可能走動;你打開門,走進去,也許還會關上門;瓶子不在房間裡。由於知道真實世界的情況和界限,你可以藉由判斷。因此我並不需要告訴你所有的細節。」
現在對於機器如何學習該水平的推理,人工智慧領域的專家知道得並不多。在向這個目標邁進途中, Facebook 正致力於製造能足夠好地學習已知世界的機器。
LeCun 說:「最大的障礙是自助式學習(unsupervised learning)。」現在機器主要通過一兩種方式進行學習,即他助式學習(supervised learning)——在系統中,向機器展示成千上萬的狗的圖片,直到機器了解了狗的特徵。 Google 的 DeepDream 以研究者反轉流程以揭示出其有效性對這一方法進行了闡釋。
另一種方式是增強學習(reinforcement learning),即機器對給出的訊息以是或否的二擇一的方式進行選擇,以給出一個答案。這種學習耗費的時間稍長,但是機器被強制由自身做出內在的抉擇。當這兩種學習方式結合起來時,就會產生強大結果。 (還記得 DeepMind Atari 嗎)。自助式學習不需要回饋或者輸入, LeCun 表示這就是人類的學習方式。我們發現、得出結論,並將其加入到人類的知識庫存之中。這,被證明是一項艱鉅的任務。
LeCun 笑著說:「我們甚至沒有一個用以發展人工智慧的基本指導原則,很明顯,我們在努力尋找。我們有很多點子,只是目前沒一個奏效罷了。」
真正人工智慧的早期探索
但是這並不是說以前的探索沒有成果。現在讓 LeCun 激動的是關於「記憶網絡」的工作,其可以被整合進卷積神經網絡,並使它們獲得記憶保持的能力。 LeCun 把這個新的記憶模型比作大腦中的分別由海馬體和大腦皮層控制的短期記憶和長期記憶( LeCun 厭惡把 CNNs 比作大腦,相反他更喜歡這個模型:一個帶有 50 億把手的黑箱)。
記憶單元允許研究者向該「記憶網絡」講說一個故事,隨後使該網絡回答關於這個故事的問題。
故事選自《魔戒》一書。我們不把全書而是書中主要情節的簡短概述(「比爾博拿到了魔戒」)講給「記憶網絡」,當被問及在書中某一具體情節中魔戒在哪裡,這個「記憶網絡」能做出簡短正確的回答。 Facebook 的 Mike Schroepfer 說(他強調技術可以幫助 Facebook 以更高的精確度向人們展示其想看到的)這意味著它理解書中事物與時間的關係。
「通過搭建能理解世界的本質、了解你所想要的是什麼的系統,我們就能幫助你。」 Schroepfer 在三月的一個開發者報告會上說道:「我們能搭建出一個系統,確保讓所有人可以把時間花在他們真正關心的事情上。」
FAIR 團隊正在圍繞這個目標開發一個被稱為「嵌入世界」的項目。在該項目中,為了幫助機器更好的理解現實, FAIR 團隊正在教它們用向量表示所有事物之間的關係,如:圖像,帖子,評論,相片及影片等之間的關係。神經網絡也在構建一個包含了能組合媒體內容、不同個體之間的距離等錯綜複雜內容的體系。
嵌入世界
Lecun 說通過使用這一系統能讓我們開始「用代數替換原因」。這表示著讓人難以置信的強大。在嵌入世界項目中開發的人工神經網絡能夠根據視覺相似性將在同一地點拍攝的兩張不同照片連接起來,並能指出文字描述是否符合場景。它重建了現實的一種虛擬記憶,並將之在其他地方和事件的背景下進行聚類。它甚至能根據一個人之前的喜好,興趣以及數字經歷「虛擬地表示這個人」。雖然這還只是帶有實驗性質的,但是對 Facebook 的新聞流呈現具有很大的影響,在跟踪標籤上也進行了一定的使用。
有很多關於長期目標的演說,但恰恰是小的勝利讓 Facebook 不斷前行。在 2014 年 6 月,他們發表了一篇名為《 DeepFace:縮小人類表現與人臉識別間差距》的文章,該文宣稱在 Facebook 的這項技術在人臉識別中已達到97%的準確率。 Lecun 說:他相信 Facebook 的人臉識別技術已達到世界第一,這也是 Facebook 與學術研究機構的一個關鍵性的區別。現在, DeepFace 是 Facebook 自動標記照片背後的驅動力。
「如果我們有一個切實有效的想法,我們就能讓它在一個月內出現在 15 億人面前。」 LeCun 說,「讓我們把目光聚焦在我們的長期目標的高度上,但是,在這個過程中會有很多我們將要去實現的會在短期具有實用性質的事。」
作為 FAIR 的研究成員之一的 Rob Fergus(右站立),正在紐約辦公室處理有關人工智慧虛擬方面的工作。
(image source :huxiu)
作為在 NYU 和 MIT 計算機科學和人工智慧實驗室工作過的老手, Rob Fergus 領導著有關計算機視覺的 AI 團隊。他們的工作已經在自動標記相片上得到使用,接下來將被用於標記影片。大量影片因為缺乏原數據,或者沒有任何描述性文本,而被「淹沒」於噪聲中。 AI 將會能夠「觀看」影片,並將它們大致分類。
這對 Facebook 阻止那些不想被上傳到他們服務器上的內容具有巨大的意義—例如色情照片,版權問題或者其他違反他們使用條款的任何內容。它也能鑑別新聞事件,對不同類型的影片進行管理。 Facebook 之前一直將這些任務劃分給外包公司,當這項技術穩定後, Facebook 就能降低這部分的人工成本。
在目前的測試中,人工智慧表現得很有希望。給它播放一段正在進行的體育影片,比如冰球、籃球或乒乓球,人工智慧能夠準確地識別出這個體育項目。並且還可以區分壘球和棒球,漂流和皮划艇,以及籃球和街球這些類似的運動。
Facebook 背後的人工智慧
Facebook 有一個叫做語言科技的獨立小組,主要負責開發翻譯,語言辨識和自然語言理解。 LeCun 所在的部門, Facebook 人工智慧研究室(FAIR)是 Facebook 人工智慧戰略研究的主力,而語言科技(從屬於應用機器學習)是實際進行軟體開發的地方。
他們與 FAIR 合作,但獨立進行開發和實踐,並且已經開發了 493 種廣泛使用的翻譯方向(從英語到法語,從法語到英語算兩種方向)。
本著讓世界更開放更連通的宗旨,語言服務是 Facebook 的一條必經之路。超過一半以上的 Facebook 用戶不說英語,然而 Facebook 上大部分的內容都是通過英語呈現的,語言科技小組的負責人 Alan Packer 說道。
約有三億三千萬用戶經常點擊「翻譯」按鈕使用這些翻譯服務。
如果你是第一個點擊翻譯按鈕的人,恭喜,你已經操作了人工智慧了。首次點擊會向服務器發出翻譯請求,之後該請求將儲存起來供其他用戶使用。 Packer 說,夏奇拉(Shakira,著名拉丁裔歌手)發布的內容總是很快就翻譯出來了。語言科技小組還推出了本地內容翻譯,通過點擊「見原文」按鈕可以體驗這項服務。
人工智慧是這項任務裡一個必要的環節,因為「傻瓜」翻譯對於人們彼此之間相互溝通作用不大,還會生成不正確的語法,誤讀的習語,俚語也無從參考。這就是過去 Google 翻譯那種直接逐詞翻譯的缺陷。
Packer 說,修辭尤其難翻譯,但人工智慧可以把握一些語義層面的含義。
「如果把『熱狗(hot dog)』這個詞組按字面翻譯成法語,是說不通的。『Chaud chien』對法國人來說沒有任何意義,」Packer說道。 「同樣如果你拿著一幅我滑雪的照片,我說,『我今天秀了一下滑雪技巧(I'm hot dogging it today)』這就變得很難理解,因為這裡的 hot dogging 是炫耀的意思。」
儘管這種理解並不算太多,但早期的結果預示著這個任務很難處理。 Packer 說,人工智慧的妙處在於它不會去理解比喻或習語,但仍會在不理解的同時認識到這一點。
人工智慧本身俱有適應性,經過訓練後便可以很快掌握俚語。語言科技小組最近發現法國球迷在用一個新俚語表達「wow」,人工智慧在接受那部分公用數據的神經網絡訓練以後,現在能夠可靠地將文本翻譯出來。他們通過每天對人工智慧進行新數據的訓練擴展 Facebook 的詞庫,不過所有語言的詞庫正在按月更新。
Facebook M
我們已經習慣於個人數字助理,比如 Siri , Cortana ,以及 Google Now 。但 Facebook 選擇了一條不同的道路,其名為「M」的新型個人AI助理擁有超越手機界限處理複雜事物的能力。 Siri 可以發短信,而 M 可以預定航班或製定旅行計劃。在開發過程中,一位 Facebook 的僱員甚至讓 M 安排了一個找搬家公司到家中進行評估的行程。 (不過當然了,你不能讓 M 給你買煙草、酒、槍支,或者給你安排色情服務。)

(image source :huxiu)
在三年內, M 有可能能夠給有線電視公司或者車輛管理部門打電話,並幫用戶線上等待,直到對方的接線員接過電話。
事實上, Facebook M 的主幹來自於今年早些時候收購的一家創業公司: Wit.ia 。他們加入了 Messenger 的小組,受 VP David Marcus 的管理,並在本月早些時候首次發布了 M 。
Alex LeBrun 在 Facebook 內部領導 Wit.ai 小組,他說人工智慧不僅幫助 M 更好地完成一般的任務,也能完成有一些特殊情況的任務,如帶一個小嬰兒旅遊,或在燈火管制日的時候旅行。這也意味著 M 的能力隨著人工智慧的發展而發展。他樂觀地認為,在三年內, M 就可能有能力呼叫有線電視公司或者車輛管理部門,並幫助用戶在線等待,直到有人接過電話。
「 M 這樣的服務最大的附加值在於它能夠完全滿足你的需求,甚至在你的需求比較特殊或比較奇怪的情況下,」 LeBrun 說,「在任務比較複雜或並非常理情況的時候,它也能完成任務。」
隨著 M 的運行,它能夠不斷學習。現在,它還沒有能力獨自運行。一個被稱為「 AI 訓練者」的小組跟 M 一起工作,如果出現 M 不懂的任務,小組會接管過來。隨後 M 可以從人類訓練者身上學到應該怎麼做,並應用到之後的任務中。在程序中還內嵌了一種隨機機制, Lebrun 說是為了讓它更像人類學習的過程。
「 AI 訓練者」是個新的職位, Facebook 本身也在對這個職位的探索中。他們說,這並不是一個給研究員或者工程師的職位,而是為那些擁有客戶服務經驗的人準備的。 Facebook 將能夠評估哪些任務需要人類的干預,但最後,他們希望在未來完成這些任務將不需要任何人類干預。
但在開發過程中,這個職位是必須的,因為他們的工作主要有兩部分:一是保證服務品質的最後一道關卡,二是訓練 AI 。
有人類智慧做看門人, M 可以在 FAIR 進行開發時當做 SandBox 來用。 「如果有什麼東西需要測試,就會在 M 中顯現,因為在我們的訓練和督導下,這個過程是沒有風險的。」Lebrun 說。
M 平台是完全建立在 Wit.ai 的平台之上的(主要在 Facebook 收購前就已研發),但 FAIR 也會對用戶和個人 AI 助理的交互過程產生的數據用作深度學習。
Facebook在人工智慧團體中的角色
「我們的研究項目都是完全公開的。幾乎我們做的每件事都會發布,大部分的程式碼也都是開源的」 LeCun 說道。你可以在 Facebook 的研究網站上和 ArXiv ——一個收納電腦科學、數學及物理研究的圖書館,找到這些出版物。
大多人工智慧團體都是這樣不隱秘的。 LeCun 已成為發展 Torch(一個針對 AI 發展的 C++ 算法庫)的領導人物。 LeCun 帶領他的團隊,還有 Twitter 和 Google 的 DeepMind 的研究人員合作,共同發展 Torch 。許多現今在這個領域的專家都曾是 LeCun 的學生。
任何他們可能出版的資料,從與醫學成像相關的資料到無人駕駛車,也都是公開以促進未來發展的, LeCun 說道。 Facebook 的研究固然對他們的用戶很重要,但它的核心價值更佳體現在讓人類對如何更好地用機器來模仿智慧的知識。
這是為什麼 Facebook 是人工智慧社區中重要的一部分,也是為什麼這個社區本身是如此重要。
「那些你在好萊塢電影裡看到的情節,譬如一個在阿拉斯加與世隔絕的人研究出了完美運作,並在當下無人能及的人工智慧系統,是完全不可能的」。 LeCun 說,「這是當代最大最複雜的科學挑戰之一,沒有任何一個人,甚至一個大公司能夠憑他們自己解決。解決它需要整個研究發展社區的集體力量」。
本文轉載自虎嘯網,原文來自於Popsci.com,原文標題為《Facebook Is Using Our Data To Build The ‘World's Best' Artificial Intelligence Lab》。