你好,歡迎來到川北在線
微信
騰訊微博
新浪微博
訪談從美國人工智能年會看 2017 世界人工智能 研究成果
時間:2017-02-13 14:01   來源:cheekr   責(zé)任編輯:毛青青

  這屆美國人工智能年會(AAAI),利用舉辦地在舊金山的地利,特別開設(shè)了為期一天的“AI in Practice”的討論,邀請了 8 家科技公司人工智能的技術(shù)主管,分享在各自領(lǐng)域的技術(shù)進展。

  從實際應(yīng)用角度來看,關(guān)鍵性的應(yīng)用幾乎不允許發(fā)生錯誤,一旦發(fā)生故障可能造成人員和財產(chǎn)損失,所以對整體系統(tǒng)包括硬件和軟件的可靠性要求非常高,實現(xiàn)難度也隨之加大。

  而面向物理世界的應(yīng)用,要求系統(tǒng)的魯棒性強,能夠處理物理世界的各種不確定性和復(fù)雜性。

  因此,從數(shù)字/物理世界、關(guān)鍵/非關(guān)鍵應(yīng)用兩個維度來分析,人工智能的應(yīng)用分成四大類:

  第一類,發(fā)生在物理世界的關(guān)鍵性應(yīng)用,比如無人駕駛,畢竟人命關(guān)天。第二類,發(fā)生在數(shù)字世界的關(guān)鍵性應(yīng)用,比如涉及到金融領(lǐng)域和計算機安全領(lǐng)域的問題,可能直接造成財產(chǎn)損失。第三類,發(fā)生在物理世界的非關(guān)鍵性應(yīng)用,比如掃地機器人。第四類,發(fā)生在數(shù)字世界的非關(guān)鍵性應(yīng)用,比如推薦系統(tǒng)。就商業(yè)應(yīng)用路線而言,一般規(guī)律是從數(shù)字世界的非關(guān)鍵應(yīng)用開始,逐步滲透到物理世界的關(guān)鍵應(yīng)用。

  發(fā)生在物理世界的關(guān)鍵性應(yīng)用

  總體而言,發(fā)生在物理世界的關(guān)鍵性應(yīng)用技術(shù)難度非常大,比如高級別的無人駕駛,是需要長時間的培育和等待的領(lǐng)域。

  “AI in Practice”的演講者之一,來自谷歌的 Vincent Vanhoucke 以及 Waymo(谷歌的無人駕駛公司)的 Dimitri Dolgov 都分享了一些研發(fā)機器人和無人駕駛的經(jīng)驗和教訓(xùn)。

  Vincent 所帶領(lǐng)的 Google Brain 團隊目前工作主要集中在三個領(lǐng)域:語音識別、計算機視覺、機器人。而 Dimitri 引用了加利福尼亞車管局(DMV)提供了 2016 年關(guān)于無人駕駛里程及失靈(Disengagements)的數(shù)據(jù)(失靈時需要人類司機來駕駛),這個數(shù)據(jù)也基本驗證了無人駕駛的難度。

  失靈比例 的是谷歌,每 5128 英里失靈 1 次,可以想象的是,谷歌無人駕駛的測試數(shù)據(jù)依舊是在一定的限定環(huán)境下,特斯拉則是 3 英里就失靈 1 次。

  即使是按照谷歌無人車現(xiàn)在這個數(shù)據(jù),在駕駛?cè)绱烁哳l的情況,離完全的無人駕駛(Lever 4 or 5)還有很長一段距離。

  按照長期以來的工業(yè)界的實踐,把可靠性從 90%提升到 99%,往往比 0%提升到 90%難很多,然而從 99%提升到 99.99%比從 90%提升到 99%更難,而我們對無人駕駛可靠性的要求可能要超過 99.9999%。

  實現(xiàn)固定嘲的幾個英里的無人駕駛距離實現(xiàn)高級別無人駕駛還有漫長的一段路要走,此外無人駕駛汽車從設(shè)計到生產(chǎn)的周期還需要額外的 3 到 5 年的時間,該行業(yè)的創(chuàng)業(yè)公司的周期會非常長。不過值得一提的是,限定嘲(比如高速公路)下的無人駕駛或者輔助駕駛依然很有意義。

  Vincent Vanhoucke 演講的最后一部分集中在機器人!他說之前還沒進入機器人領(lǐng)域時,看到 DARPA 挑戰(zhàn)賽中機器人的各種摔倒鏡頭會大笑,然后真正開始接觸之后,就再也笑不出來了。機器學(xué)習(xí)的研究人員會想當(dāng)然地認為機器人已經(jīng)大規(guī)模使用機器學(xué)習(xí)技術(shù)、想當(dāng)然地認為機器人和環(huán)境狀態(tài)完全已知、想當(dāng)然地認為樣本充足、想當(dāng)然地認為計算機模擬十分逼近真實物理世界。從這個角度,機器人領(lǐng)域給機器學(xué)習(xí)提供了很多有意思的話題。

  第一:如何協(xié)調(diào)感知和執(zhí)行是機器人的關(guān)鍵。

  機器人的感知是軟件層面,而執(zhí)行則是機械層面。做算法的不懂機械,做機械的不懂軟件往往是業(yè)界共同面臨的問題。

  第二,如何提高樣本的有效使用再次成為核心問題。

  發(fā)生在物理世界的訓(xùn)練樣本往往獲取非常困難,以機器人手臂隨機抓取物體的實驗為例,Google 為了獲得訓(xùn)練樣本,只能以 14 臺機械臂在那里日夜不停地獲得訓(xùn)練數(shù)據(jù)。如何高效率的獲得樣本,或者是高效能的使用樣本,將是極其核心的問題。

  第三,機器人領(lǐng)域涉及強化學(xué)習(xí)、無監(jiān)督學(xué)習(xí)、主動學(xué)習(xí)。

  對于機器人領(lǐng)域的核心技術(shù)強度學(xué)習(xí),特別是深度強化學(xué)習(xí)(Deep Reinforce Learning),幾乎所有我們拜訪的工程師,包括 Vincent 一致認為技術(shù)實現(xiàn)的難度非常大。

  第四,閉環(huán)控制系統(tǒng)對于改善性能極為必要。

  第五,需要新的數(shù)據(jù)結(jié)構(gòu)。

  用于表示運動學(xué)鏈接(Kinematic chain)、圖像的卷積、運動軌跡。在之后的問答環(huán)節(jié),他對遷移學(xué)習(xí)抱有厚望。

  老牌的 IBM 業(yè)務(wù)多元化、而且絕大部分是面向企業(yè)服務(wù)市場(to B)。因此,Michael Witbrock 提出對于人工智能領(lǐng)域的研究路線更為系統(tǒng)、同時也更為傳統(tǒng)。

  他提到對世界的大規(guī)模建模,由之前明確的、符號化的、分解的建模方式,逐漸融合隱形的、統(tǒng)計的建模方式。例如之前機器人動力學(xué)方程中對于摩擦力這類非線性變量的建模和求解時,難度就不小。

  IBM 強調(diào)了符號主義的重要性,認為知識表達、邏輯在解決復(fù)雜問題中非常重要。

  基于邏輯的傳統(tǒng)知識表示值得引起我們的重新思考(Rethink)。

  IBM 在此方面的研究優(yōu)勢是既有硬件,又有軟件。在整個 IBM 的研究人員 Michael Witbrock 演講中,他很自豪地介紹 IBM 過去在人工智能領(lǐng)域取得的進展,并且已經(jīng)廣泛部署到多個領(lǐng)域,其中有一項是在人力資源領(lǐng)域的應(yīng)用。

  對比一個國內(nèi)的案例,某乳品巨頭的人力資源負責(zé)人在談到人工智能在人力資源領(lǐng)域的應(yīng)用時不屑一顧地談到人力資源的工作富有人情味,冷冰冰的機器如何應(yīng)對。其實,LinkedIn 的職位招聘不也是人力資源的一部分嗎?傳統(tǒng)行業(yè)如何面對高科技的進步,被顛覆還是主動整合,看似簡單的答案要落到實地并不容易。

  值得重視的是,隨著人工智能應(yīng)用入侵傳統(tǒng)行業(yè),通常需要對控制對象所處的物理環(huán)境建模,這一塊是比互聯(lián)網(wǎng)更廣闊的天地,機會更多,當(dāng)然也更難。

  發(fā)生在數(shù)字世界的非關(guān)鍵性應(yīng)用

  從實現(xiàn)難度而言,發(fā)生在數(shù)字世界的非關(guān)鍵性應(yīng)用最容易發(fā)生,實際上推薦系統(tǒng)就是一個很好的例子,一方面大家對推薦商品的準(zhǔn)確性相對寬容。

  發(fā)生在數(shù)字世界的非關(guān)鍵性應(yīng)用擠滿各種互聯(lián)網(wǎng)公司巨頭,創(chuàng)業(yè)公司在這個領(lǐng)域想有所作為也很難,或許還有垂直領(lǐng)域有些機會。而創(chuàng)業(yè)公司如何突破人才、數(shù)據(jù)、計算資源的局限,尋找生存空間值得進一步探討。

  代表 Quora 出場的 Xavier Amatriain 恰好就回答了這個問題。Quora 是家是中小型的創(chuàng)業(yè)公司,是美國的問答網(wǎng)站(類似于國內(nèi)的知乎)。Quora 只有 85 位技術(shù)工程師,其中僅僅兩位研究員。人才寥寥、計算存儲資源不多、數(shù)據(jù)也不是那么充足,

  創(chuàng)業(yè)公司怎么能夠避免一些技術(shù)彎路,正確應(yīng)用人工智能技術(shù)呢?Xavier 總結(jié)了他這么多年在機器學(xué)習(xí)實際工作的一些教訓(xùn)。

  1. 更多的數(shù)據(jù)還是更好的算法?

  Xavier 認為更好的算法更為重要。

  對于小公司而言,本身數(shù)據(jù)量就少,而獲得標(biāo)記的數(shù)據(jù)更是需要額外的成本。小公司堆數(shù)據(jù)肯定是堆不過大公司,所以選擇把精力放在優(yōu)化算法上往往比選擇把精力放在獲取數(shù)據(jù)上更高效

  當(dāng)然一方面小公司也需要不斷地積累數(shù)據(jù)。

  2. 復(fù)雜模型還是簡單模型?

  Xavier 認為模型和特征選取需要匹配。

  模型不是越復(fù)雜越好,在創(chuàng)業(yè)公司往往是不管黑貓白貓,能抓到老鼠就是好貓。根據(jù)界定的問題,選取與特征相匹配的模型。

  3. 什么情景下用監(jiān)督學(xué)習(xí)還是非監(jiān)督學(xué)習(xí)?

  Xavier 認為非監(jiān)督學(xué)習(xí)可以降低維度、并對特征做工程突破。在某些情況下,將監(jiān)督學(xué)習(xí)和非監(jiān)督學(xué)習(xí)結(jié)合,效果出奇的好;

  4. 多種算法的組合還是單一算法?

  Xavier 提出應(yīng)該舊能使用組合算法,不同于強調(diào)原創(chuàng)性的學(xué)術(shù)研究,創(chuàng)業(yè)公司更需要“拿來主義”,只要能用上,多嘗試不同的算法組合來提高準(zhǔn)確率是個明智的選擇。

  5. 不要將一個模型的輸出作為另一系統(tǒng)的輸入

  Xavier 警告說這會是系統(tǒng)設(shè)計的噩夢。

  發(fā)生在數(shù)字世界的關(guān)鍵性應(yīng)用和發(fā)生在物理世界的非關(guān)鍵性應(yīng)用

  發(fā)生在數(shù)字世界的關(guān)鍵性應(yīng)用和發(fā)生在物理世界的非關(guān)鍵應(yīng)用對創(chuàng)業(yè)公司而言是機會比較多的領(lǐng)域。比如將人工智能用于金融領(lǐng)域和安全領(lǐng)域。又比如掃地或是玩具機器人是一個典型的發(fā)生在物理世界的非關(guān)鍵性應(yīng)用。這兩個領(lǐng)域是創(chuàng)業(yè)公司最有機會的。人工智能顛覆性的理論突破仍需等待

  通過神經(jīng)科學(xué)或是其他學(xué)科與計算科學(xué)交叉,尋找人工智能新理論的突破仍停留在理論研究階段。

  雖然深度學(xué)習(xí)已經(jīng)獲得不少進展,然而大家至今很多領(lǐng)域依舊是知其然而不知其所以然,而人工智能其實理論研究獲得的突破依舊。

  對于現(xiàn)在基于概率和數(shù)理統(tǒng)計的深度學(xué)習(xí)而言,紐約大學(xué)神經(jīng)科學(xué)教授 Gary Marcus 希望從神經(jīng)生物學(xué)的角度尋找人工智能的突破。他剛剛加入新成立的 Uber AI Lab。我們在此斷章取義地引用他的觀點,“目前對于人工智能最大的擔(dān)心是技術(shù)發(fā)展停滯不前”!這也是我們所擔(dān)心的。

  在近幾年深度學(xué)習(xí)的浪潮中,人工智能領(lǐng)域的進展更多是工程推進,而不是理論突破,尤其是海量數(shù)據(jù)和超大規(guī)模的暴力計算。正如 Peter Norvig 曾經(jīng)談到 Google 在人工智能的出色表現(xiàn)時,就評論到“我們沒有更好的算法,我們僅僅是有更多的數(shù)據(jù)”。

  而對于通用人工智能(Artificial General Intelligence),Gary 繼續(xù)批評過去幾十年徘徊不前,F(xiàn)階段的智能不能像人一樣閱讀、理解、推理,無人駕駛的安全也不足以讓人信服……

  人工智能研究的道路依舊任重道遠!

   投稿郵箱:chuanbeiol@163.com   詳情請訪問川北在線:http://dstuf.com/

川北在線-川北全搜索版權(quán)與免責(zé)聲明
①凡注明"來源:XXX(非在線)"的作品,均轉(zhuǎn)載自其它媒體,轉(zhuǎn)載目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點和對其真實性負責(zé),本網(wǎng)不承擔(dān)此類稿件侵權(quán)行為的連帶責(zé)任。
②本站所載之信息僅為網(wǎng)民提供參考之用,不構(gòu)成任何投資建議,文章觀點不代表本站立場,其真實性由作者或稿源方負責(zé),本站信息接受廣大網(wǎng)民的監(jiān)督、投訴、批評。
③本站轉(zhuǎn)載純粹出于為網(wǎng)民傳遞更多信息之目的,本站不原創(chuàng)、不存儲視頻,所有視頻均分享自其他視頻分享網(wǎng)站,如涉及到您的版權(quán)問題,請與本網(wǎng)聯(lián)系,我站將及時進行刪除處理。



圖庫
合作媒體
金寵物 綠植迷
法律顧問:ITLAW-莊毅雄律師