新浪科技訊 8月3日晚間消息,百度今日宣布啟動(dòng)智能營銷實(shí)驗(yàn)室,將重點(diǎn)利用AR和AI技術(shù)加速廣告營銷智能化。百度首席科學(xué)家吳恩達(dá)現(xiàn)場(chǎng)發(fā)表演講稱,看好AR的應(yīng)用和發(fā)展,表示相比VR,百度的重點(diǎn)將是移動(dòng)端的AR應(yīng)用,并認(rèn)為AR的未來就是人工智能。
吳恩達(dá)稱,百度在虛擬和現(xiàn)實(shí)結(jié)合領(lǐng)域上的重點(diǎn)是移動(dòng)端的AR應(yīng)用,并且已經(jīng)打造了一個(gè)名為度視(Dusee)的AR系統(tǒng)。吳恩達(dá)介紹說,在地圖場(chǎng)景、兒童教育、醫(yī)療和旅游等領(lǐng)域,AR都能有非常不錯(cuò)的應(yīng)用,能為用戶帶來更多豐富的場(chǎng)景體驗(yàn)。
此外,吳恩達(dá)還認(rèn)為AR的未來就是人工智能AI。“我們已經(jīng)看到現(xiàn)在AR是圖像和機(jī)器學(xué)習(xí)的技術(shù),未來會(huì)有更多的場(chǎng)景和應(yīng)用。比如未來如果用手機(jī)看這個(gè)小熊,你左手拿著手機(jī),右手伸出去,想跟小熊交互,要打字就非常不方便。但如果你想跟這個(gè)小熊通過講話來實(shí)現(xiàn)交互,就非常方便。所以,希望未來我們也會(huì)把語音和自然語音識(shí)別的技術(shù)放進(jìn)這個(gè)AR系統(tǒng)。”
吳恩達(dá)演講后,百度大客戶部總經(jīng)理曾華圍繞智能營銷實(shí)驗(yàn)室談及AR和AI在營銷方面的具體應(yīng)用。
曾華稱,人工智能時(shí)代下的營銷就是“場(chǎng)景+技術(shù)”,百度可以利用技術(shù)在場(chǎng)景的基礎(chǔ)上豐富廣告營銷形式。比如傳統(tǒng)營銷都是單一的文字、圖片,但不久將來可以利用技術(shù)實(shí)現(xiàn)立體化和聲音效果,“大家可以在手機(jī)上文字輸入某款車,就有那款車跳出你的手機(jī)跟你互動(dòng),你可以看到車的顏色,可以拖拉隨著你展示車的細(xì)節(jié),你也可以聽到發(fā)動(dòng)機(jī)的聲音。”
此外,曾華還表示百度目前已經(jīng)把AI技術(shù)應(yīng)用到了營銷和服務(wù)中,他解釋說:“ 百度AI營銷解決方案,這也是人工智能首次進(jìn)入真實(shí)場(chǎng)景,我們把它放到KFC,KFC在上海開了一個(gè)旗艦店,我們小度機(jī)器人成為你貼心的點(diǎn)菜人,你可以通過它進(jìn)行智能點(diǎn)餐,把食物的制作過程全面向你展開,讓你安心用餐。”(李根)
附百度首席科學(xué)家吳恩達(dá)AI-AR演講實(shí)錄:
吳恩達(dá):謝謝大家,今天非常高興在這里有機(jī)會(huì)跟大家講AI-AR增強(qiáng)現(xiàn)實(shí)的技術(shù)。最近我們看到人工智能和AR的技術(shù),在電影里我們看到特工使用AR,其實(shí)這種技術(shù),在百度做的很好的人臉識(shí)別技術(shù)可以很好的自動(dòng)識(shí)別一個(gè)人的身份,人工智能變的越來越好,可以更好的理解世界,如果我們把人工智能和AR放在一起,和世界交互的界面,希望為用戶展現(xiàn)更智能的世界。
在百度我們已經(jīng)進(jìn)入了一個(gè)人工智能的時(shí)代,所以,我們好幾年前就在人工智能的發(fā)展有巨大的投入,我們有很多非常領(lǐng)先的人工智能的技術(shù)。我個(gè)人的意見對(duì)人工智能的未來充滿信心,比如我們希望未來有陪伴機(jī)器人,也希望未來做個(gè)性化私教。這些項(xiàng)目都有很大的潛力,不過這些項(xiàng)目還是在研究的階段,今天現(xiàn)在我們?nèi)斯ぶ悄芤呀?jīng)對(duì)百度產(chǎn)品有非常大的影響。
在百度我們最核心的人工智能技術(shù)有好幾部分,包括圖像、語音、自然語言處理,選擇幾部分和大家分享,讓大家感受這些技術(shù)對(duì)AR,對(duì)增強(qiáng)現(xiàn)實(shí)的關(guān)系。
圖像,左邊這張圖,現(xiàn)在的圖像技術(shù)可以自動(dòng)輸出這張圖是什么,如果中間那張圖輸入問題,我們的技術(shù)也可以自動(dòng)輸出答案,“沖浪板是什么顏色?”“黃色”輸入右邊的視頻我們也可以自動(dòng)書櫥“一只狗在盆里玩”。所以,技術(shù)深度的理解圖片和視頻。
我們也做了很多有關(guān)人臉的技術(shù),輸入左邊的圖可以告訴你這個(gè)人是男是女,也可以預(yù)測(cè)他的年齡。人臉和OCR技術(shù)放在一起,可以做自動(dòng)的認(rèn)證。
除了圖片技術(shù),我們?cè)诎俣茸隽撕芏?D感知的技術(shù),給大家看看這些例子,我們?cè)谝粋(gè)購物中心采集的數(shù)據(jù),我們可以用這種3D技術(shù)來模擬購物中心。模型可以放進(jìn)我們的AR里面。
我們的圖像技術(shù)是怎樣做的呢?我們圖像技術(shù)大部分是機(jī)器學(xué)習(xí)平臺(tái),在百度機(jī)器學(xué)習(xí)大部分都是用這些神經(jīng)網(wǎng)絡(luò)。我們要訓(xùn)練最有效,最大,最好的神經(jīng)網(wǎng)絡(luò),我們需要使用超級(jí)計(jì)算機(jī)。大家知道中國在全世界有最領(lǐng)先的超級(jí)計(jì)算機(jī),我們?cè)谶@些超級(jí)計(jì)算機(jī)實(shí)驗(yàn)的巨大的神經(jīng)網(wǎng)絡(luò)我們也有一個(gè)手機(jī)端的引擎可以把這些放進(jìn)去,可以用手機(jī)得到非常有效的實(shí)時(shí)結(jié)果。
最后,在百度我們也做了很多有關(guān)語音的工作。其實(shí)現(xiàn)在在百度我們有很多產(chǎn)品,包括手機(jī)百度有一個(gè)非常有效的輸入法。兩年之前我們發(fā)現(xiàn)我們的語音識(shí)別準(zhǔn)確率提升得非?,給大家舉個(gè)例子,(放一段語音),你們有聽到他在講什么嗎?我們把這段語音放到語音識(shí)別系統(tǒng),它會(huì)輸出這句話“96368統(tǒng)一訂煙平臺(tái)”,一些短句的識(shí)別能力已經(jīng)遠(yuǎn)遠(yuǎn)超過人的識(shí)別能力。
再聽一段(放一段語音),我們的語音識(shí)別系統(tǒng)輸出這句話“新白娘子傳奇”,再聽一次。
除了語音識(shí)別以外,我們也在做語音合成,情感小說合成,請(qǐng)大家聽兩段語音,第一段是人工智能的語音合成系統(tǒng),第二段是 最好的情感小說合成系統(tǒng)。請(qǐng)大家聽。
。ǚ耪Z音)
我們依賴這些語音識(shí)別和語音合成的技術(shù)讓用戶更方便的用語音跟我們的產(chǎn)品交互。
在百度我們拿這些人工智能的技術(shù)放進(jìn)去,AI+AR,我們的增強(qiáng)現(xiàn)實(shí)系統(tǒng),AR把虛擬場(chǎng)景與現(xiàn)實(shí)場(chǎng)景完美融合,而且可以讓人和場(chǎng)景實(shí)時(shí)交流。
Pokemon Go也是非常好的例子。
在百度我們建設(shè)了一個(gè)新的AR系統(tǒng),我們叫“度視(Dusee)”,請(qǐng)吳中勤來做一個(gè)演示。
吳中勤:謝謝。很高興給大家展示一下度視。首先,我打開,我們?cè)诋嬅嫔锨袚Q到現(xiàn)場(chǎng)畫面,可以看到地上有一部城市地圖的畫面,當(dāng)我們把它改造成一個(gè)AR,改造成一個(gè)虛擬的場(chǎng)地。同時(shí),我們還可以對(duì)這樣的場(chǎng)地有更多的操作,比如放大,效果還是非常逼真的。謝謝大家。
吳恩達(dá):我們AR的結(jié)果是怎樣做的呢?手機(jī)的傳感器,包括手機(jī)的攝像頭來理解場(chǎng)景,然后用圖形技術(shù)來輸出這種AR的結(jié)果。VR和AR有什么關(guān)系呢?VR就是可以讓用戶感知到虛擬世界,現(xiàn)在好幾個(gè)公司都是在做VR硬件,這些硬件的好處就是可以讓你雙眼看到很多圖片,有更好的3D感覺。在AR可以把虛擬世界和現(xiàn)實(shí)世界融合,而且可以讓你看到現(xiàn)實(shí)世界和虛擬世界的交互。
在百度我們的重點(diǎn)不是這種VR、AR的硬件,我們的重點(diǎn)就是手機(jī)端的AR。有一些市場(chǎng)分析的文章估計(jì)在今天VR硬件賣了有一千萬臺(tái)左右,這一千萬臺(tái)最大的部分都是紙箱做的硬件,Pokemon Go下載量7500萬,在百度我們的產(chǎn)品已經(jīng)有數(shù)億的用戶,所以,我們用手機(jī)硬件可以把2C的技術(shù)放進(jìn)百度產(chǎn)品就可以非?斓臑閿(shù)億用戶提供非常好的AR體驗(yàn)。
你們可能知道在美國Facebook公司投入20億美金,它的CEO覺得移動(dòng)端AR會(huì) 普及。
我們講了現(xiàn)在AR可以做到什么程度,我想跟大家講講AR的未來。我覺得AR在很多應(yīng)用場(chǎng)景,比如可以用AR來做更好的搜索結(jié)果。如果你想買一臺(tái)沙發(fā),如果你用文字搜可以得到這種結(jié)果,這種結(jié)果是不錯(cuò),可以發(fā)現(xiàn)哪里可以買沙發(fā),需要多少錢。如果搜圖片可能會(huì)得到更好的結(jié)果,因?yàn)檫@些圖片讓你理解這個(gè)沙發(fā)是怎么樣的,未來用AR來搜是可以讓你理解這臺(tái)沙發(fā)在你的家會(huì)看到什么樣可能改變它的顏色等等。
AR還有很多另外的場(chǎng)景,比如在家里我希望讓兒童看到3D的動(dòng)畫,在醫(yī)療希望讓醫(yī)生更理解病情,在旅游希望看到歷史建筑的舊貌。這些場(chǎng)景,這些技術(shù)我們?cè)鯓幼瞿?我覺得圖像技術(shù)是AR的核心,現(xiàn)在可以是別人臉,而且拿到3D模型。我們更理解一個(gè)場(chǎng)景,我們可以為用戶提供更豐富的AR體驗(yàn)。
我想給大家看最后一個(gè)例子,我們以圖像為基礎(chǔ),就可以用AR得到更有趣的體驗(yàn),用手臂來源展現(xiàn)AR。在這個(gè)位置用手機(jī)看自己的手,你打開手的時(shí)候就可以看到這個(gè)小熊,你手動(dòng)來動(dòng)去,小熊也還是呆在手中間,最后你關(guān)上你的手,這個(gè)小熊就會(huì)消失了。
最后我覺得AR的未來就是人工智能,我們已經(jīng)看到現(xiàn)在AR是圖像和機(jī)器學(xué)習(xí)的技術(shù),我們這些技術(shù)做的越好我們就可以更理解場(chǎng)景,就可以提供更豐富的AR體驗(yàn),未來如果用手機(jī)看這個(gè)小熊,如果你左手拿著手機(jī),右手伸出去,如果你想跟這個(gè)小熊交互,如果你要打字就非常不方便。所以,如果你想跟這個(gè)小熊交互最方便的辦法還是用講話。所以,希望未來我們也會(huì)把語音和自然語音識(shí)別的技術(shù)放進(jìn)這個(gè)AR系統(tǒng)。
在百度我們這幾年來在人工智能發(fā)展巨大的投入,我覺得人工智能做的越好我們的AR就可以做的越好。所以,我希望未來會(huì)有更多的機(jī)會(huì)跟大家合作為用戶提供更好的AR體驗(yàn)。謝謝大家!
投稿郵箱:chuanbeiol@163.com 詳情請(qǐng)?jiān)L問川北在線:http://dstuf.com/