原標題:數(shù)以萬計的客戶在亞馬遜云科技中使用Redshift
十年前(2012年11月),亞馬遜云科技在首屆亞馬遜云科技re:Invent大會上,發(fā)布了Amazon Redshift,這是第一個完全托管、PB級的云數(shù)據(jù)倉庫。相對于傳統(tǒng)的本地數(shù)據(jù)倉庫解決方案,Amazon Redshift的發(fā)布徹底變革了行業(yè)的格局。
傳統(tǒng)的本地數(shù)據(jù)倉庫解決方案不僅成本高、缺乏彈性,而且需要很高的調(diào)整和操作技術(shù)水平。在Amazon Redshift的幫助下,使用現(xiàn)有商業(yè)智能工具分析數(shù)據(jù)不僅成本低廉,而且簡單高效。在發(fā)布之后Amazon Redshift成為亞馬遜云科技增長最快的服務(wù)之一。如今,全球范圍內(nèi),數(shù)以萬計的客戶在亞馬遜云科技中使用Redshift,每天用來處理EB級數(shù)據(jù)。
在過去的幾年里,Amazon Redshift的用例已經(jīng)發(fā)生變化。為應(yīng)對這種變化,亞馬遜云科技持續(xù)對Amazon Redsfhit進行架構(gòu)改進,來保持其行業(yè)領(lǐng)先。通過分層存儲、多集群自動擴展、跨集群數(shù)據(jù)共享以及AQUA查詢加速層等創(chuàng)新,Redshift提高了存儲和計算的可擴展性。
Amazon Redshift Serverless是云原生數(shù)據(jù)倉庫架構(gòu)創(chuàng)新的集大成者,允許客戶在無須設(shè)置和管理數(shù)據(jù)倉庫基礎(chǔ)設(shè)施的情況下運行和擴展數(shù)據(jù)分析。Amazon Redshift通過獨有特性(例如使用Spectrum查詢數(shù)據(jù)湖、Redshift ML)與亞馬遜云科技云服務(wù)進行廣泛整合與集成,使得它具備承擔(dān)超越傳統(tǒng)數(shù)據(jù)倉庫的使用場景與能力。
近日,亞馬遜云科技推出Amazon Redshift流式注入(Streaming Ingestion)功能預(yù)覽,讓客戶能夠直接從Amazon Kinesis Data Streams(一項無服務(wù)器流式數(shù)據(jù)服務(wù),可簡化任何規(guī)模的數(shù)據(jù)流捕獲、處理和存儲)向Amazon Redshift數(shù)據(jù)倉庫中注入實時數(shù)據(jù)并分析。
Amazon Redshift流式注入功能可以讓客戶無須在Amazon Simple Storage Service(Amazon S3)中暫存數(shù)據(jù),直接將每秒數(shù)百兆的流數(shù)據(jù)接收到Amazon Redshift數(shù)據(jù)倉庫集群并處理。
在游戲?qū)崟r數(shù)據(jù)分析、在線廣告點擊流分析、零售POS機數(shù)據(jù)流分析、應(yīng)用日志和網(wǎng)絡(luò)日志分析、物聯(lián)網(wǎng)設(shè)備數(shù)據(jù)分析等應(yīng)用場景中,應(yīng)用或者終端設(shè)備會在短時間內(nèi)持續(xù)生成巨量數(shù)據(jù)流。這些數(shù)據(jù)流會被送到Amazon Kinesis Data Streams進行實時緩存并最終使用Amazon Redshift完成數(shù)據(jù)分析。
以往,客戶如果想從Amazon Kinesis Data Streams向Amazon Redshift注入實時數(shù)據(jù),需要先在Amazon S3中暫存數(shù)據(jù),然后使用Copy命令加載數(shù)據(jù)來構(gòu)建數(shù)據(jù)管道,這一過程通常需要幾分鐘才能完成。但越來越多客戶希望能夠分析實時數(shù)據(jù)流以盡早獲得數(shù)據(jù)洞察。
Amazon Redshift流式注入功能的推出,滿足了客戶真實數(shù)據(jù)流對數(shù)據(jù)處理規(guī)模和實時性的要求;谶@一功能,客戶可以同時連接來自多個Amazon Kinesis Data Streams的數(shù)據(jù),將實時數(shù)據(jù)直接注入Amazon Redshift。客戶使用現(xiàn)有工具和熟悉的SQL執(zhí)行下游處理和轉(zhuǎn)換,無須額外的成本,在幾秒鐘內(nèi)從數(shù)據(jù)中獲得洞察。
Amazon Redshift流式注入大幅簡化流式數(shù)據(jù)管道構(gòu)建,加速數(shù)據(jù)處理,支持以低延遲、高吞吐量訪問數(shù)據(jù)倉庫中的實時數(shù)據(jù),幫助數(shù)據(jù)工程師、數(shù)據(jù)分析師和大數(shù)據(jù)開發(fā)者將數(shù)據(jù)分析從“批量”轉(zhuǎn)向“實時”。
目前,數(shù)以萬計的客戶每天使用Amazon Redshift處理EB級的數(shù)據(jù),為高性能商業(yè)智能(BI)報告、儀表板應(yīng)用程序、數(shù)據(jù)探索和實時分析等分析工作負載提供支持。
Amazon Redshift流式注入功能的推出將進一步豐富客戶的使用場景。客戶可將流式數(shù)據(jù)實時分析與數(shù)據(jù)倉庫中的其它數(shù)據(jù)源相結(jié)合,豐富和擴展實時分析應(yīng)用場景。
Amazon Redshift流式注入功能的推出,進一步豐富了亞馬遜云科技無服務(wù)器分析產(chǎn)品服務(wù)不同客戶業(yè)務(wù)場景的能力,可以讓客戶無須配置、擴展或管理底層基礎(chǔ)設(shè)施,即可輕松地處理實時動態(tài)的數(shù)據(jù)同步,為機器學(xué)習(xí)項目提供兼具性能和成本效益的實時特征數(shù)據(jù)準備。也為企業(yè)打造現(xiàn)代化數(shù)據(jù)戰(zhàn)略,向數(shù)據(jù)驅(qū)動型企業(yè)邁進,提供了新的創(chuàng)新方向。
投稿郵箱:chuanbeiol@163.com 詳情請訪問川北在線:http://dstuf.com/