百度騰訊阿里,其大數(shù)據(jù)優(yōu)劣勢與策略分析(2)
時間:2015-07-27 22:51 來源:川北在線 責(zé)任編輯:毛青青
2月底在北京出差時,寫了一篇《搜索引擎的大數(shù)據(jù)時代》發(fā)在虎嗅。創(chuàng)造了零回復(fù)的記錄。盡管如此,仍然沒有打消我對搜索引擎在大數(shù)據(jù)時代深層次變革的思考。
搜索引擎在大數(shù)據(jù)時代面臨的挑戰(zhàn)有:更多的暗網(wǎng)數(shù)據(jù);更多的WEB化但是沒有結(jié)構(gòu)化的數(shù)據(jù);更多的WEB化、結(jié)構(gòu)化但是封閉的數(shù)據(jù)。
這幾個挑戰(zhàn)使得數(shù)據(jù)正在遠離傳統(tǒng)搜索引擎。不過,搜索引擎在大數(shù)據(jù)上畢竟具備技術(shù)沉淀以及優(yōu)勢。
接下來,百度會向企業(yè)提供更多的數(shù)據(jù)和數(shù)據(jù)服務(wù)。前期百度與寶潔、平安等公司合作,為其提供消費者行為分析和挖掘服務(wù),通過數(shù)據(jù)結(jié)論指導(dǎo)企業(yè)推出產(chǎn)品,是一種
典型的基于大數(shù)據(jù)的C2B模式。與此類似的還有Netflix的《紙牌屋》美劇,該劇的男主角凱文·史派西和導(dǎo)演大衛(wèi)·芬奇都是通過對網(wǎng)絡(luò)數(shù)據(jù)挖掘之后,根據(jù)受歡迎情況選中的。
百度還會利用大數(shù)據(jù)完成移動互聯(lián)網(wǎng)進化。核心攻關(guān)技術(shù)便是深度學(xué)習(xí);诖髷(shù)據(jù)的機器學(xué)習(xí)將改善多媒體搜索效果和智能搜索,如語音搜索、視覺搜索和自然語言搜索。這將催生移動互聯(lián)網(wǎng)的革命性產(chǎn)品的出現(xiàn)。
盡管百度已經(jīng)出發(fā),其在大數(shù)據(jù)上可做的事情還有很多。
在數(shù)據(jù)收集方面,百度需要聚合更多高價值的交易、社交和實時數(shù)據(jù)。例如加強自己貼吧知道的社交能力、盡快讓地圖服務(wù)與O2O結(jié)合進而掌握交易數(shù)據(jù),以及推進移動App、穿戴式設(shè)備等數(shù)據(jù)收集系統(tǒng)。
在數(shù)據(jù)處理技術(shù)上,百度成立深度學(xué)習(xí)研究院加強自己在人工智能領(lǐng)域的探索,在多媒體和中文自然語言處理領(lǐng)域已經(jīng)有一些進展;云存儲、云計算的基礎(chǔ)設(shè)施建設(shè)也在逐步完善。但深度學(xué)習(xí)仍然是一個巨大的挑戰(zhàn),百度等探索者還有很多待解問題,如:無監(jiān)督式學(xué)習(xí)、立體圖像識別。
在數(shù)據(jù)變現(xiàn)方面,百度需將數(shù)據(jù)挖掘能力、數(shù)據(jù)內(nèi)容聚合和提取等形成標(biāo)準化的服務(wù)和產(chǎn)品,進而開拓大數(shù)據(jù)領(lǐng)域的企業(yè)和開發(fā)者市場。而不僅僅是頗為個性化、定制化地為大型企業(yè)提供解決。
投稿郵箱:chuanbeiol@163.com 詳情請訪問川北在線:http://dstuf.com/