国产精品乱码一区二区 I 超碰小说 I 狠狠撸视频 I 国产精品一品二区三区的使用体验 I 国产91精品在线观看 I 夜夜狠狠擅视频 I www夜片内射视频日韩精品成人 I 成人国产免费 I 污污网站免费 I 黄色片久久久 I 呦呦网 I 男女在线观看视频 I 成年人a级片 I 日韩成人免费av I 国产一区91精品张津瑜 I 美国三级a三级18 I 很污很黄的网站 I 黄色一级黄色片 I 日韩精品视频中文字幕 I 俄罗斯美女av I 五月99久久婷婷国产综合亚洲 I 免费在线视频一区二区 I 国产午夜精品一区二区理论影院 I 国产乱码av I 色婷婷视频 I 影音先锋丝袜 I 超碰人人人 I 国产成人免费电影

玉門市恒翔油脂有限公司坐落于中國第一個石油基地――玉門,是生產(chǎn)各類真空油脂和特種潤滑脂的專業(yè)公司,集研究、開發(fā)、生產(chǎn)于一體的生產(chǎn)經(jīng)營企業(yè),具有幾十年專業(yè)生產(chǎn)真空油脂和特種潤滑脂的生產(chǎn)經(jīng)驗。

TECHNOLOGY

技術(shù)與應(yīng)用

大數(shù)據(jù)流式計算關(guān)鍵技術(shù)及系統(tǒng)實例

2015-10-08 10:18 來源: 作者:

  軟件學(xué)報大數(shù)據(jù)流式計算:關(guān)鍵技術(shù)及系統(tǒng)實例bookmark0孫大為張廣艷U鄭緯民1bookmark1中國科學(xué)院軟件研究所版權(quán)所有。

  清華大學(xué)計算機(jī)科學(xué)與技術(shù)系,北京100084)2(符號計算與知識工程教育部重點(diǎn),批量計算首先進(jìn)行數(shù)據(jù)的存儲,然后再對存儲的靜態(tài)數(shù)據(jù)進(jìn)行集中計算。Hadoop是典型的大數(shù)據(jù)批量計算架構(gòu),由HDFS分布式文件系統(tǒng)負(fù)責(zé)靜態(tài)數(shù)據(jù)的存儲,并通過MapReduce將計算邏輯分配到各數(shù)據(jù)節(jié)點(diǎn)進(jìn)行數(shù)據(jù)計算和價值發(fā)現(xiàn);如所示,流式計算中,無法確定數(shù)據(jù)的到來時刻和到來順序,也無法將全部數(shù)據(jù)存儲起來。因此,不再進(jìn)行流式數(shù)據(jù)的存儲,而是當(dāng)流動的數(shù)據(jù)到來后在內(nèi)存中直接進(jìn)行數(shù)據(jù)的實時計算。如Twitter的Storm、Yahoo的S4就是典型的流式數(shù)據(jù)計算架構(gòu),數(shù)據(jù)在任務(wù)拓?fù)渲斜挥嬎悖⑤敵鲇袃r值的信息。

  流式計算和批量計算分別適用于不同的大數(shù)據(jù)應(yīng)用場景:對于先存儲后計算,實時性要求不高,同時,數(shù)據(jù)的準(zhǔn)確性、全面性更為重要的應(yīng)用場景,批量計算模式更合適;對于無需先存儲,可以直接進(jìn)行數(shù)據(jù)計算,實時性要求很嚴(yán)格,但數(shù)據(jù)的精確度要求稍微寬松的應(yīng)用場景,流式計算具有明顯優(yōu)勢。流式計算中,數(shù)據(jù)往往是最近一個時間窗口內(nèi)的,因此數(shù)據(jù)延遲往往較短,實時性較強(qiáng),但數(shù)據(jù)的精確程度往往較低。流式計算和批量計算具有明顯的優(yōu)劣互補(bǔ)特征,在多種應(yīng)用場合下可以將兩者結(jié)合起來使用。通過發(fā)揮流式計算的實時性優(yōu)勢和批量計算的計算精度優(yōu)勢,滿足多種應(yīng)用場景在不同階段的數(shù)據(jù)計算要求。

  目前,關(guān)于大數(shù)據(jù)批量計算相關(guān)技術(shù)的研究相對成熟,形成了以Google的MapReduce編程模型、開源的Hadoop計算系統(tǒng)為代表的高效、穩(wěn)定的批量計算系統(tǒng),在理論上和實踐中均取得了顯著成果。關(guān)于流式計算的早期研究往往集中在數(shù)據(jù)庫環(huán)境中開展數(shù)據(jù)計算的流式化,數(shù)據(jù)規(guī)模較小,數(shù)據(jù)對象比較單一。由于新時期的流式大數(shù)據(jù)呈現(xiàn)出實時性、易失性、突發(fā)性、無序性、無限性等特征,對系統(tǒng)提出了很多新的更高的要求。2010年,Yahoo推出S4流式計算系統(tǒng),2011年,Twitter推出Storm流式計算系統(tǒng),在一定程度上推動了大數(shù)據(jù)流式計算技術(shù)的發(fā)展和應(yīng)用。但是,這些系統(tǒng)在可伸縮性、系統(tǒng)容錯、狀態(tài)一致性、負(fù)載均衡、數(shù)據(jù)吞吐量等諸多方面仍然存在著明顯不足。如何構(gòu)建低延遲、高吞吐且持續(xù)可靠運(yùn)行的大數(shù)據(jù)流式計算系統(tǒng),是當(dāng)前亟待解決的問題。

  本文以大數(shù)據(jù)流式計算系統(tǒng)的設(shè)計、優(yōu)化和挑戰(zhàn)為核心,系統(tǒng)地梳理和分析了當(dāng)前大數(shù)據(jù)流式計算系統(tǒng)的研究和發(fā)展現(xiàn)狀,總結(jié)了在金融銀行業(yè)應(yīng)用、互聯(lián)網(wǎng)應(yīng)用和物聯(lián)網(wǎng)應(yīng)用這三大典型領(lǐng)域中,流式大數(shù)據(jù)所呈現(xiàn)出的實時性、易失性、突發(fā)性、無序性、無限性等特征。給出了理想的大數(shù)據(jù)流式計算系統(tǒng)在系統(tǒng)結(jié)構(gòu)、數(shù)據(jù)傳輸、應(yīng)用接口、高可用技術(shù)等方面應(yīng)該具有的關(guān)鍵技術(shù)特性,論述并對比了5款大數(shù)據(jù)流式計算系統(tǒng),即,Twitter的Storm系統(tǒng)、Yahoo的S4系統(tǒng)、Facebook的DataFreewayandPuma系統(tǒng)、Linkedin的Kafka系統(tǒng)、Microsoft的TimeStream系統(tǒng)。闡述了大數(shù)據(jù)流式計算系統(tǒng)在可伸縮性、系統(tǒng)容錯、狀態(tài)一致性、負(fù)載均衡、數(shù)據(jù)吞吐量等方面所面臨的技術(shù)挑戰(zhàn)。本文工作為構(gòu)建低延遲、高吞吐且持續(xù)可靠運(yùn)行的大數(shù)據(jù)流式計算系統(tǒng)提供了一些指導(dǎo)性原則,彌補(bǔ)了當(dāng)前關(guān)于大數(shù)據(jù)流式計算的研究成果不足的局面。

  本文第1節(jié)分析大數(shù)據(jù)流式計算的典型應(yīng)用領(lǐng)域及其特征。第2節(jié)論述設(shè)計優(yōu)良的大數(shù)據(jù)流式計算系統(tǒng)在系統(tǒng)結(jié)構(gòu)、數(shù)據(jù)傳輸、應(yīng)用接口、高可用技術(shù)等方面應(yīng)該滿足的關(guān)鍵技術(shù)要求。第3節(jié)分析對比5款比較典型的大數(shù)據(jù)流式計算系統(tǒng)。第4節(jié)具體闡述大數(shù)據(jù)流式計算在系統(tǒng)的可伸縮性、系統(tǒng)容錯、狀態(tài)一致性、負(fù)載均衡、數(shù)據(jù)吞吐量等方面所面臨的新的挑戰(zhàn)。最后,第5節(jié)對全文進(jìn)行總結(jié)。

  1應(yīng)用場景及數(shù)據(jù)特征大數(shù)據(jù)流式計算主要用于對動態(tài)產(chǎn)生的數(shù)據(jù)進(jìn)行實時計算并及時反饋結(jié)果,但往往不要求結(jié)果絕對精確的應(yīng)用場景。在數(shù)據(jù)的有效時間內(nèi)獲取其價值,是大數(shù)據(jù)流式計算系統(tǒng)的首要設(shè)計目標(biāo),因此,當(dāng)數(shù)據(jù)到來后將立即對其進(jìn)行計算,而不再對其進(jìn)行緩存等待后續(xù)全部數(shù)據(jù)到來再進(jìn)行計算。

  1.1應(yīng)用場景大數(shù)據(jù)流式計算的應(yīng)用場景較多,本文按照數(shù)據(jù)產(chǎn)生方式、數(shù)據(jù)規(guī)模大小以及技術(shù)成熟度高低這3個不同維度,選擇金融銀行業(yè)應(yīng)用、互聯(lián)網(wǎng)應(yīng)用和物聯(lián)網(wǎng)應(yīng)用這3種典型應(yīng)用場景,用于分析說明大數(shù)據(jù)流式計算的基本特征。從數(shù)據(jù)產(chǎn)生方式上看,它們分別是被動產(chǎn)生數(shù)據(jù)、主動產(chǎn)生數(shù)據(jù)和自動產(chǎn)生數(shù)據(jù);從數(shù)據(jù)規(guī)模上看,它們處理的數(shù)據(jù)分別是小規(guī)模、中規(guī)模和大規(guī)模;從技術(shù)成熟度上看,它們分別是成熟度高、成熟度中和成熟度低的數(shù)據(jù)。

  金融銀行業(yè)的應(yīng)用在金融銀行領(lǐng)域的日常運(yùn)營過程中,往往會產(chǎn)生大量數(shù)據(jù),這些數(shù)據(jù)的時效性往往較短。因此,金融銀行領(lǐng)域是大數(shù)據(jù)流式計算最典型的應(yīng)用場景之一,也是大數(shù)據(jù)流式計算最早的應(yīng)用領(lǐng)域。在金融銀行系統(tǒng)內(nèi)部,每時每刻都有大量的往往是結(jié)構(gòu)化的數(shù)據(jù)在各個系統(tǒng)間流動,并需要實時計算。同時,金融銀行系統(tǒng)與其他系統(tǒng)也有著大量的數(shù)據(jù)流動,這些數(shù)據(jù)不僅有結(jié)構(gòu)化數(shù)據(jù),也會有半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)。通過對這些大數(shù)據(jù)的流式計算,發(fā)現(xiàn)隱含于其中的內(nèi)在特征,可以幫助金融銀行系統(tǒng)進(jìn)行實時決策。

  在金融銀行的實時監(jiān)控場景中,大數(shù)據(jù)流式計算往往體現(xiàn)出了自身的優(yōu)勢。如:風(fēng)險管理。包括信用卡詐騙、保險詐騙、證券交易詐騙、程序交易等,需要實時跟蹤發(fā)現(xiàn);營銷管理。如,根據(jù)客戶信用卡消費(fèi)記錄,掌握客戶的消費(fèi)習(xí)慣和偏好,預(yù)測客戶未來的消費(fèi)需求,并為其推薦個性化的金融產(chǎn)品和服務(wù);商業(yè)智能。如,掌握金融銀行系統(tǒng)內(nèi)部各系統(tǒng)的實時數(shù)據(jù),實現(xiàn)對全局狀態(tài)的監(jiān)控和優(yōu)化,并提供決策支持。

  互聯(lián)網(wǎng)領(lǐng)域的應(yīng)用隨著互聯(lián)網(wǎng)技術(shù)的不斷發(fā)展,特別是Web 2.0時代的到來,用戶可以實時分享和提供各類數(shù)據(jù)。不僅使得數(shù)據(jù)量大為增加,也使得數(shù)據(jù)更多地以半結(jié)構(gòu)化和非結(jié)構(gòu)化的形態(tài)呈現(xiàn)。據(jù)統(tǒng)計,目前互聯(lián)網(wǎng)中75%的數(shù)據(jù)來源于個人,主要以圖片、音頻、視頻數(shù)據(jù)形式存在,需要實時分析和計算這些大量、動態(tài)的數(shù)據(jù)。

  在互聯(lián)網(wǎng)領(lǐng)域中,大數(shù)據(jù)流式計算的典型應(yīng)用場景包括:搜索引擎。搜索引擎提供商們往往會在反饋給客戶的搜索頁面中加入點(diǎn)擊付費(fèi)的廣告信息。插入什么廣告、在什么位置插入這些廣告才能得到最佳效果,往往需要根據(jù)客戶的查詢偏好、瀏覽歷史、地理位置等綜合語義進(jìn)行決定。而這種計算對于搜索服務(wù)器而言往往是大量的:一方面,每時每刻都會有大量客戶進(jìn)行搜索請求;另一方面,數(shù)據(jù)計算的時效性極低,需要保證極短的響應(yīng)時間;社交網(wǎng)站。需要實時分析用戶的狀態(tài)信息,及時提供最新的用戶分享信息到相關(guān)的朋友,準(zhǔn)確地推薦朋友,推薦主題,提升用戶體驗,并能及時發(fā)現(xiàn)和屏蔽各種欺騙行為。

  物聯(lián)網(wǎng)領(lǐng)域的應(yīng)用在物聯(lián)網(wǎng)環(huán)境中,各個傳感器產(chǎn)生大量數(shù)據(jù)。這些數(shù)據(jù)通常包含時間、位置、環(huán)境和行為等內(nèi)容,具有明顯的顆粒性。由于傳感器的多元化、差異化以及環(huán)境的多樣化,這些數(shù)據(jù)呈現(xiàn)出鮮明的異構(gòu)性、多樣性、非結(jié)構(gòu)化、有噪聲、高增長率等特征。所產(chǎn)生的數(shù)據(jù)量之密集、實時性之強(qiáng)、價值密度之低是前所未有的,需要進(jìn)行實時、高效的計算。

  在物聯(lián)網(wǎng)領(lǐng)域中,大數(shù)據(jù)流式計算的典型應(yīng)用場景包括:智能交通。通過傳感器實時感知車輛、道路的狀態(tài),并分析和預(yù)測一定范圍、一段時間內(nèi)的道路流量情況,以便有效地進(jìn)行分流、調(diào)度和指揮;環(huán)境監(jiān)控。通過傳感器和移動終端,對一個地區(qū)的環(huán)境綜合指標(biāo)進(jìn)行實時監(jiān)控、遠(yuǎn)程查看、智能聯(lián)動、遠(yuǎn)程控制,系統(tǒng)地解決綜合環(huán)境問題。

  這些對計算系統(tǒng)的實時性、吞吐量、可靠性等方面都提出很高要求。

  大數(shù)據(jù)流式計算的3種典型應(yīng)用場景的對比見表1.從數(shù)據(jù)的產(chǎn)生方式看,金融銀行領(lǐng)域的數(shù)據(jù)往往是在系統(tǒng)中被動產(chǎn)生的,互聯(lián)網(wǎng)領(lǐng)域的數(shù)據(jù)往往是人為主動產(chǎn)生的,物聯(lián)網(wǎng)領(lǐng)域的數(shù)據(jù)往往是由傳感器等設(shè)備自動產(chǎn)生的;從數(shù)據(jù)的規(guī)模來看:金融銀行領(lǐng)域的數(shù)據(jù)與互聯(lián)網(wǎng)、物聯(lián)網(wǎng)領(lǐng)域的數(shù)據(jù)相比較少;物聯(lián)網(wǎng)領(lǐng)域的數(shù)據(jù)規(guī)模是最大的,但受制于物聯(lián)網(wǎng)的發(fā)展階段,當(dāng)前實際擁有數(shù)據(jù)規(guī)模最大的是互聯(lián)網(wǎng)領(lǐng)域;從技術(shù)成熟度來看:金融銀行領(lǐng)域的流式大數(shù)據(jù)應(yīng)用最為成熟,從早期的復(fù)雜事件處理開始就呈現(xiàn)了大數(shù)據(jù)流式計算的思想;互聯(lián)網(wǎng)領(lǐng)域的發(fā)展,將大數(shù)據(jù)流式計算真正推向歷史舞臺;物聯(lián)網(wǎng)領(lǐng)域的發(fā)展為大數(shù)據(jù)流式計算提供了重要的歷史機(jī)遇。

  金融銀行互聯(lián)網(wǎng)物聯(lián)網(wǎng)動動動被主自小中大高中低表1大數(shù)據(jù)流式計算應(yīng)用場景對比1.2流式大數(shù)據(jù)特征用有向無環(huán)圖(directedacyclicgraph,簡稱DAG)描述了大數(shù)據(jù)流的計算過程,其中,圓形表示數(shù)據(jù)的計算節(jié)點(diǎn),箭頭表示數(shù)據(jù)的流動方向。

  與大數(shù)據(jù)批量計算不同,大數(shù)據(jù)流式計算中的數(shù)據(jù)流主要體現(xiàn)了如下5個特征:流式大數(shù)據(jù)是實時產(chǎn)生、實時計算,結(jié)果反饋往往也需要保證及時性。流式大數(shù)據(jù)價值的有效時間往往較短,大部分?jǐn)?shù)據(jù)到來后直接在內(nèi)存中進(jìn)行計算并丟棄,只有少量數(shù)據(jù)才被長久保存到硬盤中。這就需要系統(tǒng)有足夠的低延遲計算能力,可以快速地進(jìn)行數(shù)據(jù)計算,在數(shù)據(jù)價值有效的時間內(nèi),體現(xiàn)數(shù)據(jù)的有用性。對于時效性特別短、潛在價值又很大的數(shù)據(jù)可以優(yōu)先計算。

  在大數(shù)據(jù)流式計算環(huán)境中,數(shù)據(jù)流往往是到達(dá)后立即被計算并使用,只有極少數(shù)的數(shù)據(jù)才會被持久化地保存下來,大多數(shù)數(shù)據(jù)往往會被直接丟棄。數(shù)據(jù)的使用往往是一次性的、易失的,即使重放,得到的數(shù)據(jù)流和之前的數(shù)據(jù)流往往也是不同的。這就需要系統(tǒng)具有一定的容錯能力,要充分地利用好僅有的一次數(shù)據(jù)計算機(jī)會,盡可能全面、準(zhǔn)確、有效地從數(shù)據(jù)流中得出有價值的信息。

  在大數(shù)據(jù)流式計算環(huán)境中,數(shù)據(jù)的產(chǎn)生完全由數(shù)據(jù)源確定,由于不同的數(shù)據(jù)源在不同時空范圍內(nèi)的狀態(tài)不統(tǒng)一且發(fā)生動態(tài)變化,導(dǎo)致數(shù)據(jù)流的速率呈現(xiàn)出了突發(fā)性的特征。前一時刻數(shù)據(jù)速率和后一時刻數(shù)據(jù)速率可能會有巨大的差異,這就需要系統(tǒng)具有很好的可伸縮性,能夠動態(tài)適應(yīng)不確定流入的數(shù)據(jù)流,具有很強(qiáng)的系統(tǒng)計算能力和大數(shù)據(jù)流量動態(tài)匹配的能力。一方面,在突發(fā)高數(shù)據(jù)流速的情況下,保證不丟棄數(shù)據(jù),或者識別并選擇性地丟棄部分不重要的數(shù)據(jù);另一方面,在低數(shù)據(jù)速率的情況下,保證不會太久或過多地占用系統(tǒng)資源。

  在大數(shù)據(jù)流式計算環(huán)境中,各數(shù)據(jù)流之間、同一數(shù)據(jù)流內(nèi)部各數(shù)據(jù)元素之間是無序的:一方面,由于各個數(shù)據(jù)源之間是相互獨(dú)立的,所處的時空環(huán)境也不盡相同,因此無法保證數(shù)據(jù)流間的各個數(shù)據(jù)元素的相對順序;另一方面,即使是同一個數(shù)據(jù)流,由于時間和環(huán)境的動態(tài)變化,也無法保證重放數(shù)據(jù)流和之前數(shù)據(jù)流中數(shù)據(jù)元素順序的一致性。這就需要系統(tǒng)在數(shù)據(jù)計算過程中具有很好的數(shù)據(jù)分析和發(fā)現(xiàn)規(guī)律的能力,不能過多地依賴數(shù)據(jù)流間的內(nèi)在邏輯或者數(shù)據(jù)流內(nèi)部的內(nèi)在邏輯。

  無限性在大數(shù)據(jù)流式計算中,數(shù)據(jù)是實時產(chǎn)生、動態(tài)增加的,只要數(shù)據(jù)源處于活動狀態(tài),數(shù)據(jù)就會一直產(chǎn)生和持續(xù)增加下去。可以說,潛在的數(shù)據(jù)量是無限的,無法用一個具體確定的數(shù)據(jù)實現(xiàn)對其進(jìn)行量化。系統(tǒng)在數(shù)據(jù)計算過程中,無法保存全部數(shù)據(jù):一方面,硬件中沒有足夠大的空間來存儲這些無限增長的數(shù)據(jù);另一方面,也沒有合適的軟件來有效地管理這么多數(shù)據(jù);并且,需要系統(tǒng)具有很好的穩(wěn)定性,保證系統(tǒng)長期而穩(wěn)定地運(yùn)行。

  表2對比了大數(shù)據(jù)流式計算和大數(shù)據(jù)批量計算的需求。

  表2大數(shù)據(jù)流式、批量需求對比性能指標(biāo)大數(shù)據(jù)流式計算大數(shù)據(jù)批量計算計算方式實時批量常駐空間內(nèi)存硬盤時效性短長有序性無有數(shù)據(jù)量無限有限數(shù)據(jù)速率突發(fā)穩(wěn)定是否可重現(xiàn)難易移動對象數(shù)據(jù)移動程序移動數(shù)據(jù)精確度較低較高2大數(shù)據(jù)流式計算關(guān)鍵技術(shù)針對具有實時性、易失性、突發(fā)性、無序性、無限性等特征的流式大數(shù)據(jù),理想的大數(shù)據(jù)流式計算系統(tǒng)應(yīng)該表現(xiàn)出低延遲、高吞吐、持續(xù)穩(wěn)定運(yùn)行和彈性可伸縮等特性,這其中離不開系統(tǒng)架構(gòu)、數(shù)據(jù)傳輸、編程接口、高可用技術(shù)等關(guān)鍵技術(shù)的合理規(guī)劃和良好設(shè)計。

  2.1系統(tǒng)架構(gòu)系統(tǒng)架構(gòu)是系統(tǒng)中各子系統(tǒng)間的組合方式,屬于大數(shù)據(jù)計算所共有的關(guān)鍵技術(shù),大數(shù)據(jù)流式計算需要選擇特定的系統(tǒng)架構(gòu)進(jìn)行流式計算任務(wù)的部署。當(dāng)前,大數(shù)據(jù)流式計算系統(tǒng)采用的系統(tǒng)架構(gòu)可以分為無中心節(jié)點(diǎn)的對稱式系統(tǒng)架構(gòu)(如S4,Puma等系統(tǒng))以及有中心節(jié)點(diǎn)的主從式架構(gòu)(如Storm系統(tǒng)):對稱式架構(gòu)。如所示:系統(tǒng)中各個節(jié)點(diǎn)的功能是相同的,具有良好的可伸縮性;但由于不存在中心節(jié)點(diǎn),在資源調(diào)度、系統(tǒng)容錯、負(fù)載均衡等方面需要通過分布式協(xié)議實現(xiàn)。例如,S4通過Zookeeper實現(xiàn)系統(tǒng)容錯、負(fù)載均衡等功能;主從式系統(tǒng)架構(gòu)。如所示:系統(tǒng)存在一個主節(jié)點(diǎn)和多個從節(jié)點(diǎn),主節(jié)點(diǎn)負(fù)責(zé)系統(tǒng)資源的管理和任務(wù)的協(xié)調(diào),并完成系統(tǒng)容錯、負(fù)載均衡等方面的工作;從節(jié)點(diǎn)負(fù)責(zé)接收來自于主節(jié)點(diǎn)的任務(wù),并在計算完成后進(jìn)行反饋。各個從節(jié)點(diǎn)間沒有數(shù)據(jù)往來,整個系統(tǒng)的運(yùn)行完全依賴于主節(jié)點(diǎn)控制。

  2.2數(shù)據(jù)傳輸數(shù)據(jù)傳輸是指完成有向任務(wù)圖到物理計算節(jié)點(diǎn)的部署之后,各個計算節(jié)點(diǎn)之間的數(shù)據(jù)傳輸方式。在大數(shù)據(jù)流式計算環(huán)境中,為了實現(xiàn)高吞吐和低延遲,需要更加系統(tǒng)地優(yōu)化有向任務(wù)圖以及有向任務(wù)圖到物理計算節(jié)點(diǎn)的映射方式。如所示,在大數(shù)據(jù)流式計算環(huán)境中,數(shù)據(jù)的傳輸方式分為主動推送方式(基于push方式)和被動拉取方式(基于pull方式):主動推送方式。在上游節(jié)點(diǎn)產(chǎn)生或計算完數(shù)據(jù)后,主動將數(shù)據(jù)發(fā)送到相應(yīng)的下游節(jié)點(diǎn),其本質(zhì)是讓相關(guān)數(shù)據(jù)主動尋找下游的計算節(jié)點(diǎn),當(dāng)下游節(jié)點(diǎn)報告發(fā)生故障或負(fù)載過重時,將后續(xù)數(shù)據(jù)流推送到其他相應(yīng)節(jié)點(diǎn)。主動推送方式的優(yōu)勢在于數(shù)據(jù)計算的主動性和及時性,但由于數(shù)據(jù)是主動推送到下游節(jié)點(diǎn),往往不會過多地考慮到下游節(jié)點(diǎn)的負(fù)載狀態(tài)、工作狀態(tài)等因素,可能會導(dǎo)致下游部分節(jié)點(diǎn)負(fù)載不夠均衡;被動拉取方式。只有下游節(jié)點(diǎn)顯式進(jìn)行數(shù)據(jù)請求,上游節(jié)點(diǎn)才會將數(shù)據(jù)傳輸?shù)较掠喂?jié)點(diǎn),其本質(zhì)是讓相關(guān)數(shù)據(jù)被動地傳輸?shù)较掠斡嬎愎?jié)點(diǎn)。被動拉取方式的優(yōu)勢在于下游節(jié)點(diǎn)可以根據(jù)自身的負(fù)載狀態(tài)、工作狀態(tài)適時地進(jìn)行數(shù)據(jù)請求,但上游節(jié)點(diǎn)的數(shù)據(jù)可能未必得到及時的計算。

  大數(shù)據(jù)流式計算的實時性要求較高,數(shù)據(jù)需要得到及時處理,往往選擇主動推送的數(shù)據(jù)傳輸方式。當(dāng)然,主動推送方式和被動拉取方式不是完全對立的,也可以將兩者進(jìn)行融合,從而在一定程度上實現(xiàn)更好的效果。

  2.3編程接口編程接口是方便用戶根據(jù)流式計算的任務(wù)特征,通過有向任務(wù)圖來描述任務(wù)內(nèi)在邏輯和依賴關(guān)系,并編程實現(xiàn)任務(wù)圖中各節(jié)點(diǎn)的處理功能。用戶策略的定制、業(yè)務(wù)流程的描述和具體應(yīng)用的實現(xiàn),需要通過大數(shù)據(jù)流式計算系統(tǒng)提供的應(yīng)用編程接口。良好的應(yīng)用編程接口可以方便用戶實現(xiàn)業(yè)務(wù)邏輯,可以減少用戶的編程工作量,并降低用戶系統(tǒng)功能的實現(xiàn)門檻。

  當(dāng)前,大多數(shù)開源大數(shù)據(jù)流式計算系統(tǒng)均提供了類似于MapReduce的類MR用戶編程接口。例如:Storm提供Spout和Bolt應(yīng)用編程接口,用戶只需要定制Spout和Bolt的功能,并規(guī)定數(shù)據(jù)流在各個Bolt間的內(nèi)在流向,明確數(shù)據(jù)流的有向無環(huán)圖,其他具體細(xì)節(jié)的實現(xiàn)方式用戶不需要太多關(guān)心,即可滿足對流式大數(shù)據(jù)的高效、實時計算;也有部分大數(shù)據(jù)流式計算系統(tǒng)為用戶提供了類SQL的應(yīng)用編程接口,并給出了相應(yīng)的組件,便于應(yīng)用功能的實現(xiàn);StreamBase系統(tǒng)不僅為用戶提供了類SQL的應(yīng)用編程接口來描述計算過程,也借助圖形化用戶視窗為用戶提供了豐富的組件。

  2.4高可用技術(shù)大數(shù)據(jù)批量計算將數(shù)據(jù)事先存儲到持久設(shè)備上,節(jié)點(diǎn)失效后容易實現(xiàn)數(shù)據(jù)重放;而大數(shù)據(jù)流式計算對數(shù)據(jù)不進(jìn)行持久化存儲。因此,批量計算中的高可用技術(shù)不完全適用于流式計算環(huán)境,需要根據(jù)流式計算新特征及其新的高可用要求,有針對性地研究更加輕量、高效的高可用技術(shù)和方法。

  大數(shù)據(jù)流式計算系統(tǒng)高可用是通過狀態(tài)備份和故障恢復(fù)策略實現(xiàn)的。當(dāng)故障發(fā)生后,系統(tǒng)根據(jù)預(yù)先定義的策略進(jìn)行數(shù)據(jù)的重放和恢復(fù)。按照實現(xiàn)策略,可以細(xì)分為被動等待(passivestandby)、主動等待(activestandby)和上游備份(upstreambackup)這3種策略:如所示:主節(jié)點(diǎn)5進(jìn)行數(shù)據(jù)計算,副本節(jié)點(diǎn)5'處于待命狀態(tài),系統(tǒng)會定期地將主節(jié)點(diǎn)5上的最新的狀態(tài)備份到副本節(jié)點(diǎn)5'上。出現(xiàn)故障時,系統(tǒng)從備份數(shù)據(jù)中進(jìn)行狀態(tài)恢復(fù)。被動等待策略支持?jǐn)?shù)據(jù)負(fù)載較高、吞吐量較大的場景,但故障恢復(fù)時間較長,可以通過對備份數(shù)據(jù)的分布式存儲縮短恢復(fù)時間。該方式更適合于精確式數(shù)據(jù)恢復(fù),可以很好地支持不確定性計算應(yīng)用,在當(dāng)前流式數(shù)據(jù)計算中應(yīng)用最為廣泛。

  如所示:系統(tǒng)在為主節(jié)點(diǎn)5傳輸數(shù)據(jù)的同時,也為副本節(jié)點(diǎn)5'傳輸一份數(shù)據(jù)副本。以主節(jié)點(diǎn)5為主進(jìn)行數(shù)據(jù)計算,當(dāng)主節(jié)點(diǎn)5出現(xiàn)故障時,副本節(jié)點(diǎn)5'完全接管主節(jié)點(diǎn)5的工作,主副節(jié)點(diǎn)需要分配同樣的系統(tǒng)資源。

  該種方式故障恢復(fù)時間最短,但數(shù)據(jù)吞吐量較小,也浪費(fèi)了較多的系統(tǒng)資源。在廣域網(wǎng)環(huán)境中,系統(tǒng)負(fù)載往往不是過大時,主動等待策略是一個比較好的選擇,可以在較短的時間內(nèi)實現(xiàn)系統(tǒng)恢復(fù)。

  如所示:每個主節(jié)點(diǎn)均記錄其自身的狀態(tài)和輸出數(shù)據(jù)到日志文件,當(dāng)某個主節(jié)點(diǎn)5出現(xiàn)故障后,上游主節(jié)點(diǎn)會重放日志文件中的數(shù)據(jù)到相應(yīng)副本節(jié)點(diǎn)5'中,進(jìn)行數(shù)據(jù)的重新計算。上游備份策略所占用的系統(tǒng)資源最小,在無故障期間,由于副本節(jié)點(diǎn)5'保持空閑狀態(tài),數(shù)據(jù)的執(zhí)行效率很高。但由于其需要較長的時間進(jìn)行恢復(fù)狀態(tài)的重構(gòu),故障的恢復(fù)時間往往較長。如當(dāng)需要恢復(fù)時間窗口為30分鐘的聚類計算,就需要重放該30分鐘內(nèi)的所有元組。可見,對于系統(tǒng)資源比較稀缺、算子狀態(tài)較少的情況,上游備份策略是一個比較好的選擇方案。

  上游備份策略表3從5個方面詳細(xì)對比了上述3種高可用策略,實際應(yīng)用中可以根據(jù)具體環(huán)境進(jìn)行選擇。

  表33種高可用策略對比性能指標(biāo)被動等待策略主動等待策略上游備份策略系統(tǒng)性能低高恢復(fù)速度中高低資源使用中高低精準(zhǔn)恢復(fù)是否適用范圍局域網(wǎng)廣域網(wǎng)局域網(wǎng)或廣域網(wǎng)2.5其他關(guān)鍵技術(shù)此外,大數(shù)據(jù)流式計算系統(tǒng)也離不開其他相關(guān)關(guān)鍵技術(shù)的支持,包括:系統(tǒng)故障恢復(fù)。快速地實現(xiàn)從故障狀態(tài)到一種正確狀態(tài)的恢復(fù),滿足系統(tǒng)的高效運(yùn)行需求;系統(tǒng)資源調(diào)度。實現(xiàn)對系統(tǒng)中資源的最佳利用,提高資源的利用率,保證任務(wù)的完成和能耗的節(jié)省;負(fù)載均衡策略。實現(xiàn)對系統(tǒng)中的任務(wù)的動態(tài)、合理的分配,動態(tài)適應(yīng)系統(tǒng)負(fù)載情況,保證系統(tǒng)中的任務(wù)均衡和穩(wěn)定地運(yùn)行;數(shù)據(jù)在任務(wù)拓?fù)渲械穆酚刹呗浴4龠M(jìn)系統(tǒng)中負(fù)載均衡策略的高效實現(xiàn)、數(shù)據(jù)的合理流動及快速處理。

  3系統(tǒng)實例分析文選擇當(dāng)前比較典型的、應(yīng)用較為廣泛的、具有代表性的前5款大數(shù)據(jù)流式計算系統(tǒng)進(jìn)行實例分析。

  Storm是Twitter支持開發(fā)的一款分布式的、開源的、實時的、主從式大數(shù)據(jù)流式計算系統(tǒng),最新版本是Storm0.8.2,使用的協(xié)議為EclipsePublicLicense1.0,其核心部分使用了高效流式計算的函數(shù)式語言Clojure編寫,極大地提高了系統(tǒng)性能。但為了方便用戶使用,支持用戶使用任意編程語言進(jìn)行項目的開發(fā)。

  任務(wù)拓?fù)洌╰opology)是Storm的邏輯單元,一個實時應(yīng)用的計算任務(wù)將被打包為任務(wù)拓?fù)浜蟀l(fā)布,任務(wù)拓?fù)湟坏┨峤缓髮恢边\(yùn)行著,除非顯式地去中止。一個任務(wù)拓?fù)涫怯梢幌盗蠸pout和Bolt構(gòu)成的有向無環(huán)圖,通過數(shù)據(jù)流(stream)實現(xiàn)Spout和Bolt之間的關(guān)聯(lián),如0所示。其中,Spout負(fù)責(zé)從外部數(shù)據(jù)源不間斷地讀取數(shù)據(jù),并以Tuple元組的形式發(fā)送給相應(yīng)的Bolt;Bolt負(fù)責(zé)對接收到的數(shù)據(jù)流進(jìn)行計算,實現(xiàn)過濾、聚合、查詢等具體功能,可以級聯(lián),也可以向外發(fā)送數(shù)據(jù)流。

  數(shù)據(jù)流是Storm對數(shù)據(jù)進(jìn)行的抽象,它是時間上無窮的Tuple元組序列,如1所示,數(shù)據(jù)流是通過流分組(streamgrouping)所提供的不同策略實現(xiàn)在任務(wù)拓?fù)渲辛鲃印4送猓瑸榱藵M足確保消息能且僅能被計算1次的需求,Storm還提供了事務(wù)任務(wù)拓?fù)洹?/P>

  作業(yè)級容錯機(jī)制用戶可以為一個或多個數(shù)據(jù)流作業(yè)(以下簡稱數(shù)據(jù)流)進(jìn)行編號,分配一個唯一的ID,Storm可以保障每個編號的數(shù)據(jù)流在任務(wù)拓?fù)渲斜煌耆珗?zhí)行。所謂的完全執(zhí)行,是指由該ID綁定的源數(shù)據(jù)流以及由該源數(shù)據(jù)流后續(xù)生成的新數(shù)據(jù)流經(jīng)過任務(wù)拓?fù)渲忻恳粋€應(yīng)該到達(dá)的Bolt,并被完全執(zhí)行。如2所示,兩個數(shù)據(jù)流被分配一個TD=1,當(dāng)且僅當(dāng)兩個數(shù)據(jù)流分別經(jīng)過Bolt 2,最終都到達(dá)Bolt3并均被完全處理后,才表明數(shù)據(jù)流被完全執(zhí)行。

  Storm通過系統(tǒng)級組件Acker實現(xiàn)對數(shù)據(jù)流的全局計算路徑的跟蹤,并保證該數(shù)據(jù)流被完全執(zhí)行。其基本原理是為數(shù)據(jù)流中的每個分組進(jìn)行編號,并通過異或運(yùn)算來實現(xiàn)對其計算路徑的跟蹤。

  作業(yè)級容錯的基本原理是:作業(yè)級容錯的基本流程是:在Spout中,系統(tǒng)會為數(shù)據(jù)流的每個分組生成一個唯一的64位整數(shù),作為該分組的根ID.根ID會被傳遞給Acker及后續(xù)的Bolt作為該分組單元的唯一標(biāo)識符。同時,無論是Spout還是Bolt,每次新生成一個分組的時候,都會重新賦予該分組一個新的64位的整數(shù)的ID.Spout發(fā)送完某個數(shù)據(jù)流對應(yīng)的源分組后,并告知Acker自己所發(fā)射分組的根ID及生成的那些分組的新ID,而Bolt每次接受到一個輸入分組并計算完之后,也將告知Acker自己計算的輸入分組的ID及新生成的那些分組的ID,Acker只需要對這些ID做一個簡單的異或運(yùn)算,就能判斷出該根ID對應(yīng)的消息單元是否計算完成。

  Storm采用主從系統(tǒng)架構(gòu),如3所示,在一個Storm系統(tǒng)中有兩類節(jié)點(diǎn)(即,一個主節(jié)點(diǎn)Nimbus、多個從主節(jié)點(diǎn)Nimbus運(yùn)行在master環(huán)境中,是無狀態(tài)的,負(fù)責(zé)全局的資源分配、任務(wù)調(diào)度、狀態(tài)監(jiān)控和故障檢測:一方面,主節(jié)點(diǎn)Nimbus接收客戶端提交來的任務(wù),驗證后分配任務(wù)到從節(jié)點(diǎn)Supervisor上,同時把該任務(wù)的元信息寫入Zookeeper目錄中;另一方面,主節(jié)點(diǎn)Nimbus需要通過Zookeeper實時監(jiān)控任務(wù)的執(zhí)行情況,當(dāng)出現(xiàn)故障時進(jìn)行故障檢測,并重啟失敗的從節(jié)點(diǎn)Supervisor和工作進(jìn)程Worker;從節(jié)點(diǎn)Supervisor運(yùn)行在slaves環(huán)境中,也是無狀態(tài)的,負(fù)責(zé)監(jiān)聽并接受來自于主節(jié)點(diǎn)Nimbus所分配的任務(wù),并啟動或停止自己所管理的工作進(jìn)程Worker,其中,工作進(jìn)程Worker負(fù)責(zé)具體任務(wù)的執(zhí)行。一個完整的任務(wù)拓?fù)渫煞植荚诙鄠€從節(jié)點(diǎn)Supervisor上的Worker進(jìn)程來協(xié)調(diào)執(zhí)行,每個Worker都執(zhí)行且僅執(zhí)行任務(wù)拓?fù)渲械囊粋€子集。在每個Worker內(nèi)部,會有多個Executor,每個Executor對應(yīng)一個線程。Task負(fù)責(zé)具體數(shù)據(jù)的計算,即,用戶所實現(xiàn)的Spout/Blot實例。每個Executor會對應(yīng)一個或多個Task,因此,系統(tǒng)中Executor的數(shù)量總是小于等于Task的數(shù)量。

  Zookeeper是一個針對大型分布式系統(tǒng)的可靠協(xié)調(diào)服務(wù)和元數(shù)據(jù)存儲系統(tǒng),通過配置Zookeeper集群,可以使用Zookeeper系統(tǒng)所提供的高可靠性服務(wù)。Storm系統(tǒng)引入Zookeeper,極大地簡化了Nimbus,Supervisor,Worker之間的設(shè)計,保障了系統(tǒng)的穩(wěn)定性。Zookeeper在Storm系統(tǒng)中具體實現(xiàn)了以下功能:⑷存儲客戶端提交的任務(wù)拓?fù)湫畔ⅰ⑷蝿?wù)分配信息、任務(wù)的執(zhí)行狀態(tài)信息等,便于主節(jié)點(diǎn)Nimbus監(jiān)控任務(wù)的執(zhí)行情況;(b)存儲從節(jié)點(diǎn)Supervisor、工作進(jìn)程Worker的狀態(tài)和心跳信息,便于主節(jié)點(diǎn)Nimbus監(jiān)控系統(tǒng)各節(jié)點(diǎn)運(yùn)行狀態(tài);(c)存儲整個集群的所有狀態(tài)信息和配置信息,便于主節(jié)點(diǎn)Nimbus監(jiān)控Zookeeper集群的狀態(tài),在出現(xiàn)主Zookeeper節(jié)點(diǎn)掛掉后可以重新選取一個節(jié)點(diǎn)作為主Zookeeper節(jié)點(diǎn),并進(jìn)行恢復(fù)。

  3Storm系統(tǒng)架構(gòu)Storm系統(tǒng)的主要特征為:⑻簡單編程模型。用戶只需編寫Spout和Bolt部分的實現(xiàn),因此極大地降低了實時大數(shù)據(jù)流式計算的復(fù)雜性;(b)支持多種編程語言。默認(rèn)支持ClojureJava,Ruby和Python,也可以通過添加相關(guān)協(xié)議實現(xiàn)對新增語言的支持;(c)作業(yè)級容錯性。可以保證每個數(shù)據(jù)流作業(yè)被完全執(zhí)行;(d)水平可擴(kuò)展。計算可以在多個線程、進(jìn)程和服務(wù)器之間并發(fā)執(zhí)行;(e)快速消息計算。通過ZeroMQ作為其底層消息隊列,保證了消息能夠得到快速的計算。

  Storm系統(tǒng)存在的不足主要包括:資源分配沒有考慮任務(wù)拓?fù)涞慕Y(jié)構(gòu)特征,無法適應(yīng)數(shù)據(jù)負(fù)載的動態(tài)變化;采用集中式的作業(yè)級容錯機(jī)制,在一定程度上限制了系統(tǒng)的可擴(kuò)展性。

  S4是Yahoo支持開發(fā)的一款分布式的、可擴(kuò)展的、可插拔的、對稱的大數(shù)據(jù)流式計算系統(tǒng),最新版本是S4處理單元PE(processingelement)如4所示,是S4中的基本計算單元,由4個組件構(gòu)成,即:(a)函數(shù)。實現(xiàn)了與該處理單元PE相對應(yīng)的功能和配置;(b)事件類型。規(guī)定了該處理單元PE所接收的事件類型;(c)主鍵。規(guī)定了該處理單元PE所關(guān)心的事件主鍵;(d)鍵值。規(guī)定了該處理單元PE所匹配的鍵值。

  (函數(shù))(事件類型)(主鍵)(鍵值)4處理單元PE處理單元PE只關(guān)心與其事件類型相匹配的事件,并僅僅處理與其主鍵、鍵值相一致的事件,即,只有事件類型、主鍵、鍵值全部匹配后,處理單元PE才會處理該類事件。當(dāng)一個新事件沒有可以匹配的處理單元PE時,系統(tǒng)將會為該事件新創(chuàng)建一個處理單元PE.因此,需要高效、動態(tài)地創(chuàng)建、管理和刪除處理單元PE;同時,處理單元PE的類型設(shè)計及其拓?fù)浣Y(jié)構(gòu)也需要更合理地規(guī)劃。

  有一類處理單元PE位于S4的輸入層,它們沒有主鍵、鍵值,只需事件類型相匹配,即對該類事件進(jìn)行處理。

  通常情況下,該類處理單元PE所計算的事件為原始輸入事件,其輸出事件會被新增主鍵、鍵值,以便后續(xù)處理單元PE進(jìn)行計算。

  在S4系統(tǒng)中,數(shù)據(jù)流是由事件的有序序列構(gòu)成的,其中,分別表示該類型事件的若干個和若干個和都是tap/e-va/Me式即,fcey=va/Me的元組值。事件在各個處理單元PE中被計算,在處理單元PE之間流動,處理單元PE之間的邏輯構(gòu)成了一個有向無環(huán)圖。

  5描述了一個統(tǒng)計Topi熱點(diǎn)單詞的實例。

  在5所示的有向無環(huán)圖中,節(jié)點(diǎn)表示處理單元PE,實現(xiàn)對數(shù)據(jù)流的計算和新數(shù)據(jù)流的輸出,有向邊表示事件的有序序列(r,4)及其流向。在該實例中,實現(xiàn)了對于流式數(shù)據(jù)中的Topr熱點(diǎn)單詞的統(tǒng)計,其數(shù)據(jù)流的具體內(nèi)容見表4,其中,數(shù)據(jù)流1是初始化數(shù)據(jù)流,因此其主鍵值為空,鍵值為實時流入的文本數(shù)據(jù),在處理單元PE1中被分割為各個單詞,形成了新的數(shù)據(jù)流,其事件類型為單詞統(tǒng)計,主鍵為word=x,鍵值為counts,并分別分流到處理單元PE2、處理單元PE3、處理單元PE4等節(jié)點(diǎn)中進(jìn)行計算,并再次形成了新的數(shù)據(jù)流,其事件類型為單詞數(shù)更新,主鍵為SortID=x,鍵值為word=y,count=z,并分別分流到處理單元PE5、處理單元PE6、處理單元PE7等節(jié)點(diǎn)中進(jìn)行計算,最后在處理單元PE8中進(jìn)行匯總和排序,得出當(dāng)前的Topr個熱點(diǎn)單詞。

  表4數(shù)據(jù)流內(nèi)容數(shù)據(jù)流事件類型主鍵鍵值查詢無單詞統(tǒng)計單詞數(shù)更新匯總降序輸出無在S4的處理節(jié)點(diǎn)Pnode中,如6所示,由處理空間和傳輸空間組成,其中,84處理節(jié)點(diǎn)空間在處理空間中,事件監(jiān)聽系統(tǒng)主要用于監(jiān)聽并分發(fā)接收到的事件計算請求,并由調(diào)度分配系統(tǒng)將事件分配到處理單元集PEC(processingelementcontainer)上進(jìn)行計算,處理單元集PEC以適當(dāng)?shù)捻樞蛘{(diào)用適當(dāng)?shù)奶幚韱卧狿E,并保證每個主鍵A:e>的處理單元PE都會被映射到一個確定的處理節(jié)點(diǎn)Pnode上。

  之后,處理節(jié)點(diǎn)Pnode或者發(fā)出輸出事件,或者向傳輸層請求協(xié)助,向指定邏輯節(jié)點(diǎn)發(fā)送消息。其中,處理單元集PEC由一個處理節(jié)點(diǎn)Pnode中內(nèi)部的多個處理單元PE組成。處理單元PE是事件計算的最小單元,接受一個或多個來自于事件源或其他處理單元PE的事件進(jìn)行計算,之后,分發(fā)一個或多個計算后的事件到其他處理單元PE或輸出結(jié)果。各個處理單元PE間相互獨(dú)立,它們之間通過事件構(gòu)成關(guān)聯(lián),事件在各處理單元PE間以數(shù)據(jù)流的形式進(jìn)行傳輸;在傳輸空間中,主要通過路由管理、負(fù)載均衡、集群管理、容錯管理等實現(xiàn)對事件流的路由選擇、負(fù)載均衡、邏輯影射、故障恢復(fù)到備用節(jié)點(diǎn)等方面的管理和功能,并通過Zookeeper系統(tǒng)在S4集群節(jié)點(diǎn)間實現(xiàn)一致性協(xié)作。S4通過插件式的架構(gòu)來動態(tài)選擇信息傳輸協(xié)議,對于控制信息,通常采用可靠傳輸協(xié)議,如TCP,保障控制信息傳輸?shù)目煽啃浴τ跀?shù)據(jù)信息,通常采用不可靠傳輸協(xié)議,如UDP,保障數(shù)據(jù)信息的高吞吐量。

  系統(tǒng)架構(gòu)處理單元集PEC用戶空間S4采用了對等式系統(tǒng)架構(gòu),如7所示。

  (性能監(jiān)控(客戶適配器)c配置維護(hù)(T名字服務(wù))7S4系統(tǒng)結(jié)構(gòu)在一個S4系統(tǒng)中,由用戶空間、資源調(diào)度空間和S4處理節(jié)點(diǎn)空間組成,其中,在用戶空間中,多個用戶可以通過本地的客戶端驅(qū)動實現(xiàn)服務(wù)的請求訪問;在資源調(diào)度空間中,為用戶提供了客戶適配器,通過TCP/IP協(xié)議實現(xiàn)用戶的客戶端驅(qū)動與客戶適配器間的連接和通信,多個用戶可以并發(fā)地與多個客戶適配器進(jìn)行服務(wù)請求;在S4處理節(jié)點(diǎn)空間中,提供了多個處理節(jié)點(diǎn)Pnode,進(jìn)行用戶服務(wù)請求的計算。各個處理節(jié)點(diǎn)間保持相對的獨(dú)立性、對等性和高并發(fā)性,極大地提高了系統(tǒng)的性能,并通過Hash方式將事件路由到一個或多個目標(biāo)處理節(jié)點(diǎn)Pnode上。

  S4系統(tǒng)存在的不足主要包括:當(dāng)數(shù)據(jù)流到達(dá)速度超過一定界限時,到達(dá)速度越高,系統(tǒng)數(shù)據(jù)處理的錯誤率越大;不支持系統(tǒng)節(jié)點(diǎn)的熱插拔,所有對節(jié)點(diǎn)的調(diào)整都必須離線進(jìn)行;僅支持部分容錯,即,節(jié)點(diǎn)失效轉(zhuǎn)移時會丟失原節(jié)點(diǎn)內(nèi)存中的狀態(tài)信息。

  數(shù)據(jù)傳輸通道和大數(shù)據(jù)流式計算系統(tǒng)。

  系統(tǒng)ZK節(jié)點(diǎn)DataFreeway是Facebook支持開發(fā)的一款可擴(kuò)展數(shù)據(jù)流架構(gòu)(scalabledatastreamframework),可以有效地支持4種數(shù)據(jù)間的傳輸,即,文件到文件、文件到消息、消息到消息和消息到文件。其系統(tǒng)結(jié)構(gòu)如8所示,DataFreeway數(shù)據(jù)流架構(gòu)由4個組件構(gòu)成,即,Scribe,Calligraphus,ContinuousCopier和PTail.Scribe組件位于用戶端,其功能是將用戶的數(shù)據(jù)通過RPC發(fā)送到服務(wù)器端;Calligraphus組件實現(xiàn)了對日志類型的維護(hù)與管理,其功能是通過Zookeeper系統(tǒng),將位于緩沖區(qū)中的數(shù)據(jù)并發(fā)寫到HDFS中;ContinuousCopier組件的功能是實現(xiàn)在各個HDFS系統(tǒng)間進(jìn)行文件的遷移;PTail組件實現(xiàn)了并行地將文件輸出。

  所示,當(dāng)前最新寫數(shù)據(jù)流備份數(shù)據(jù)流| PTail子系統(tǒng)Puma3子系統(tǒng)讀數(shù)據(jù)流。HBase節(jié)點(diǎn)1 HBase子系統(tǒng)Serving子系統(tǒng);統(tǒng)延遲。Puma3哈希表,每個表從Puma3中將中讀取副本,進(jìn)系統(tǒng)實現(xiàn)時,在Calligraphus階項對應(yīng)一個Key及用戶定義的內(nèi)存中的數(shù)據(jù)備份到HBase中了數(shù)據(jù)聚合功能,極大地提高了數(shù)據(jù)的計算能力,有效地降低了系段通過聚合主鍵完成對數(shù)據(jù)的分片,其中,每個分片都是內(nèi)存中的聚合方法,如統(tǒng)計、求和、平均值等操作。HBase子系統(tǒng)會定期地,進(jìn)行數(shù)據(jù)的持久化存儲。只有當(dāng)Puma3發(fā)生故障時,才從HBase行數(shù)據(jù)的重放,實現(xiàn)對因故障丟失數(shù)據(jù)的恢復(fù);在無故障的情況下,HBase子系統(tǒng)不參與數(shù)據(jù)的計算,因此提高了數(shù)據(jù)的計算能力。

  DataFreewayandPuma系統(tǒng)存在的不足主要包括:數(shù)據(jù)延遲在秒級,無法滿足大數(shù)據(jù)流式計算所需要的毫秒級應(yīng)用需求;將哈希表完全放入內(nèi)存的加速機(jī)制,導(dǎo)致內(nèi)存需求量大;資源調(diào)度策略不夠簡單、高效,不能靈活適應(yīng)連續(xù)的工作負(fù)載。

  KafW38,54-56是Lrnkedm所支持的一款開源的、分布式的、高吞吐量的發(fā)布訂閱消息系統(tǒng),可以有效地處理互聯(lián)網(wǎng)中活躍的流式數(shù)據(jù),如網(wǎng)站的頁面瀏覽量、用戶訪問頻率、訪問統(tǒng)計、好友動態(tài)等,最新版本是Kafka0.8,開發(fā)語言是Scala,可以使用Java進(jìn)行編寫。

  Kafka系統(tǒng)在設(shè)計過程中主要考慮到了以下需求特征:消息持久化是一種常態(tài)需求;吞吐量是系統(tǒng)需要滿足的首要目標(biāo);消息的狀態(tài)作為訂閱者(consumer)存儲信息的一部分,在訂閱者服務(wù)器中進(jìn)行存儲;將發(fā)布者(producer)、代理(broker)和訂閱者(consumer)顯式地分布在多臺機(jī)器上,構(gòu)成顯式的分布式系統(tǒng)。形成了以下關(guān)鍵特性:在磁盤中實現(xiàn)消息持久化的時間復(fù)雜度為0(1),數(shù)據(jù)規(guī)模可以達(dá)到TB級別;實現(xiàn)了數(shù)據(jù)的高吞吐量,可以滿足每秒數(shù)十萬條消息的處理需求;實現(xiàn)了在服務(wù)器集群中進(jìn)行消息的分片和序列管理;實現(xiàn)了對Hadoop系統(tǒng)的兼容,可以將數(shù)據(jù)并行地加載到Hadoop集群中。

  Kafka消息系統(tǒng)的架構(gòu)是由發(fā)布者(producer)、代理(broker)和訂閱者(consumer)共同構(gòu)成的顯式分布式架發(fā)布訂閱者構(gòu),即,分別位于不同的節(jié)點(diǎn)上,如0所示。各部分構(gòu)成一個完整的邏輯組,并對外界提供服務(wù),各部分間通過消息(message)進(jìn)行數(shù)據(jù)傳輸。其中,發(fā)布者可以向一個主題(topic)推送相關(guān)消息,訂閱者以組為單位,可以關(guān)注并拉取自己感興趣的消息,通過Zookeeper實現(xiàn)對訂閱者和代理的全局狀態(tài)信息的管理,及其負(fù)載均衡的實現(xiàn)。

  數(shù)據(jù)存儲Kafka消息系統(tǒng)通過僅僅進(jìn)行數(shù)據(jù)追加的方式實現(xiàn)對磁盤數(shù)據(jù)的持久化保存,實現(xiàn)了對大數(shù)據(jù)的穩(wěn)定存儲,并有效地提高了系統(tǒng)的計算能力。通過采用Sendfile系統(tǒng)調(diào)用方式優(yōu)化了網(wǎng)絡(luò)傳輸,減少了1次內(nèi)存拷貝,提高了系統(tǒng)的吞吐量,即使對于普通的硬件,Kafka消息系統(tǒng)也可以支持每秒數(shù)十萬的消息處理能力。此外,在Kafka消息系統(tǒng)中,通過僅保存訂閱者已經(jīng)計算數(shù)據(jù)的偏量信息,一方面可以有效地節(jié)省數(shù)據(jù)的存儲空間,另一方面,也簡化了系統(tǒng)的計算方式,方便了系統(tǒng)的故障恢復(fù)。

  Kafka消息系統(tǒng)采用了推送、拉取相結(jié)合的方式進(jìn)行消息的傳輸,其中,當(dāng)發(fā)布者需要傳輸消息時,會主動地推送該消息到相關(guān)的代理節(jié)點(diǎn);當(dāng)訂閱者需要訪問數(shù)據(jù)時,其會從代理節(jié)點(diǎn)中進(jìn)行拉取。通常情況下,訂閱者可以從代理節(jié)點(diǎn)中拉取自己感興趣的主題消息。

  在Kafka消息系統(tǒng)中,發(fā)布者和代理節(jié)點(diǎn)之間沒有負(fù)載均衡機(jī)制,但可以通過專用的第4層負(fù)載均衡器在Kafka代理之上實現(xiàn)基于TCP連接的負(fù)載均衡的調(diào)整。訂閱者和代理節(jié)點(diǎn)之間通過Zookeeper實現(xiàn)了負(fù)載均衡機(jī)制,在Zookeeper中管理全部活動的訂閱者和代理節(jié)點(diǎn)信息,當(dāng)有訂閱者和代理節(jié)點(diǎn)的狀態(tài)發(fā)生變化時,才實時進(jìn)行系統(tǒng)的負(fù)載均衡的調(diào)整,保障整個系統(tǒng)處于一個良好的均衡狀態(tài)。

  Kafka系統(tǒng)存在的不足主要包括:只支持部分容錯,即,節(jié)點(diǎn)失效轉(zhuǎn)移時會丟失原節(jié)點(diǎn)內(nèi)存中的狀態(tài)信息;代理節(jié)點(diǎn)沒有副本機(jī)制保護(hù),一旦代理節(jié)點(diǎn)出現(xiàn)故障,該代理節(jié)點(diǎn)中的數(shù)據(jù)將不再可用;代理節(jié)點(diǎn)不保存訂閱者的狀態(tài),刪除消息時無法判斷該消息是否已被閱讀。

  TimeStream是Microsoft在Streamlnsight的基礎(chǔ)上開發(fā)的一款分布式的、低延遲的、實時連續(xù)的大數(shù)據(jù)流式計算系統(tǒng),通過彈性替代機(jī)制,可以自適應(yīng)因故障恢復(fù)和動態(tài)配置所導(dǎo)致的系統(tǒng)負(fù)載均衡的變化,使用C.NET來編寫。

  TimeStream的開發(fā)是基于大數(shù)據(jù)流式計算以下兩點(diǎn)來考慮的:(a)連續(xù)到達(dá)的流式大數(shù)據(jù)已經(jīng)遠(yuǎn)遠(yuǎn)超出了單臺物理機(jī)器的計算能力,分布式的計算架構(gòu)成為必然的選擇;(b)新產(chǎn)生的流式大數(shù)據(jù)必須在極短的時間延遲內(nèi),經(jīng)過相關(guān)任務(wù)拓?fù)溥M(jìn)行計算后,產(chǎn)生出能夠反映該輸入數(shù)據(jù)特征的計算結(jié)果。

  TimeStream中的數(shù)據(jù)計算邏輯是基于數(shù)據(jù)流DAG實現(xiàn)的,如1所示,在數(shù)據(jù)流DAG中的每個頂點(diǎn)V,在獲取輸入數(shù)據(jù)流/后,觸發(fā)相關(guān)操作/產(chǎn)生新數(shù)據(jù)流,并更新頂點(diǎn)v的狀態(tài)從ljA即,(A)=/v(M)。

  1數(shù)據(jù)流任務(wù)拓?fù)漤旤c(diǎn)在TimeStream中,一個數(shù)據(jù)流子圖sub-DAG是指在數(shù)據(jù)流DAG中,兩頂點(diǎn)及該兩頂點(diǎn)間的全部頂點(diǎn)和有向邊的集合,即,滿足:對于數(shù)據(jù)流子圖sub-DAG中任意兩頂點(diǎn)vi和v2,以及數(shù)據(jù)流DAG中任意一頂點(diǎn)V,若頂點(diǎn)V位于頂點(diǎn)V1和V2的有向邊上,那么頂點(diǎn)V?定是數(shù)據(jù)流子圖sub-DAG的一個頂點(diǎn)。數(shù)據(jù)流子圖sub-DAG在邏輯上可以簡化為一個與其功能相同的頂點(diǎn),如2所示,在一個由7個頂點(diǎn)所組成的數(shù)據(jù)流DAG中,由頂點(diǎn)V2,V3,V4和V5及其有向邊所構(gòu)成的數(shù)據(jù)流子圖sub-DAG,可以簡化為一個輸入數(shù)據(jù)流為/、輸出數(shù)據(jù)流為的邏輯頂點(diǎn)。

  在TimeStream中,當(dāng)出現(xiàn)服務(wù)器故障或系統(tǒng)負(fù)載劇烈持續(xù)變化的情況時,可以通過數(shù)據(jù)流子圖sub-DAG間、數(shù)據(jù)流子圖sub-DAG與頂點(diǎn)間以及各頂點(diǎn)間的彈性等價替代,動態(tài)、實時地適應(yīng)系統(tǒng)的負(fù)載變化需求。具體而言,彈性等價替代可以進(jìn)一步細(xì)分為3種情況:頂點(diǎn)間的彈性等價替代。當(dāng)數(shù)據(jù)流DAG中的任意一頂點(diǎn)v出現(xiàn)故障不能正常工作時,系統(tǒng)會啟動一個具有相同功能的頂點(diǎn)V,并接管頂點(diǎn)v的工作;數(shù)據(jù)流子圖sub-DAG與頂點(diǎn)間的彈性等價替代。如2所示,當(dāng)整個系統(tǒng)的負(fù)載過輕時,為了節(jié)省系統(tǒng)的資源,可以通過一個新的頂點(diǎn)v代替由頂點(diǎn)V2,V3,V4和V5所組成的數(shù)據(jù)流子圖sub-DAG,該新頂點(diǎn)v將實現(xiàn)數(shù)據(jù)流子圖sub-DAG的全部功能;反之,當(dāng)系統(tǒng)的負(fù)載過重時,也可以用一個數(shù)據(jù)流子圖sub-DAG代替任意一個頂點(diǎn)v,實現(xiàn)功能的分解和任務(wù)的分擔(dān);數(shù)據(jù)流子圖sub-DAG間的彈性等價替代。如3所示,右側(cè)由頂點(diǎn)V2,V3,V4和V5所組成的數(shù)據(jù)流子圖sub-DAG實現(xiàn)了HashPartition,Computation和Union等功能,但當(dāng)系統(tǒng)的Computation功能的計算量突然持續(xù)增大后,用左側(cè)由頂點(diǎn)V8,v9,vi0,v,vi2和vn所組成的數(shù)據(jù)流子圖sub-DAG彈性等價替代右側(cè)的子圖,實現(xiàn)了將Computation計算節(jié)點(diǎn)由2個增加到4個,提高了Computation的計算能力。

  通過彈性等價替代機(jī)制可以有效地適應(yīng)系統(tǒng)因故障和負(fù)載的變化對系統(tǒng)性能產(chǎn)生的影響,保證系統(tǒng)性能的穩(wěn)定性;但在彈性等價替代的過程中,一定要實現(xiàn)替代子圖或頂點(diǎn)間的等價,并盡可能地進(jìn)行狀態(tài)的恢復(fù)。所謂的等價,即對于相同的輸入,子圖或頂點(diǎn)可以在功能上產(chǎn)生相同的輸出,唯一存在的區(qū)別在于其性能的不同。

  狀態(tài)的恢復(fù)是通過對數(shù)據(jù)流DAG中的依賴關(guān)系跟蹤機(jī)制來實現(xiàn),并盡可能全面地進(jìn)行系統(tǒng)狀態(tài)的恢復(fù)。

  在TimeStream的系統(tǒng)結(jié)構(gòu)中,實現(xiàn)了資源分配、節(jié)點(diǎn)調(diào)度、故障檢測等功能。

  如4所示,位于頭節(jié)點(diǎn)(headnode)中的集群管理器(clustermanager,簡稱CM)實現(xiàn)了對系統(tǒng)資源的管理和任務(wù)的分配,位于計算節(jié)點(diǎn)(computenode)的節(jié)點(diǎn)服務(wù)器(nodeservice,簡稱NS)實現(xiàn)了對計算節(jié)點(diǎn)的管理和維護(hù)。當(dāng)一個新的數(shù)據(jù)流任務(wù)進(jìn)入系統(tǒng)被計算時:首先,系統(tǒng)為該任務(wù)分配一個全局唯一的查詢協(xié)調(diào)器(querycoordinator,簡稱QC),查詢協(xié)調(diào)器QC向集群管理器CM請求資源運(yùn)行任務(wù)的數(shù)據(jù)流DAG;其次,向節(jié)點(diǎn)服務(wù)器NS請求調(diào)度頂點(diǎn)處理器(vertexprocesses,簡稱VP),并實現(xiàn)數(shù)據(jù)流DAG的構(gòu)建;再次,實施數(shù)據(jù)計算;最后,查詢協(xié)調(diào)器QC和頂點(diǎn)處理器VP均會實時地跟蹤系統(tǒng)的運(yùn)行情況,并定期地將相關(guān)元數(shù)據(jù)信息保持到數(shù)據(jù)庫中,在出現(xiàn)系統(tǒng)故障或負(fù)載劇烈持續(xù)變化的情況時,可以通過這些被永久保存的元數(shù)據(jù)進(jìn)行系統(tǒng)狀態(tài)的恢復(fù)和實時動態(tài)的調(diào)整。

  存在不足TimeStream系統(tǒng)存在的不足主要包括:數(shù)據(jù)延遲在秒級,無法滿足毫秒級的應(yīng)用需求;基于依賴關(guān)系跟蹤的容錯機(jī)制降低了系統(tǒng)性能,當(dāng)系統(tǒng)規(guī)模為16個節(jié)點(diǎn)時,系統(tǒng)吞吐量下降了10%左右。

  3.6對比分析系統(tǒng)進(jìn)行了對比分析。

  表5數(shù)據(jù)流系統(tǒng)對比性能指標(biāo)S4系統(tǒng)系統(tǒng)架構(gòu)主從對稱主從數(shù)據(jù)傳輸拉取推送推送拉取拉取應(yīng)用接口MR接口SQL接口高可用性上游備份策略被動等待策略主動等待策略被動等待策略上游備份策略開發(fā)語言容錯機(jī)制作業(yè)級容錯部分容錯依賴關(guān)系跟蹤精確恢復(fù)否是資源利用率高低高狀態(tài)持久化否是否是數(shù)據(jù)去重否是否編程模型純編程編程+XML純編程負(fù)載均衡不支持部分支持支持典型應(yīng)用社交網(wǎng)絡(luò)廣告投放站點(diǎn)統(tǒng)計好友動態(tài)微博情感分析可以看到:在體系結(jié)構(gòu)方面:Storm,Kafka,TimeStream選擇了主從式體系結(jié)構(gòu),S4和DataFreewayandPuma均選擇了對稱式體系結(jié)構(gòu);在應(yīng)用接口方面:Storm,S4,Puma,Kafka均選擇了類MapReduce接口,簡化了用戶的編程;TimeStream選擇了用戶更為熟悉的類SQL接口。此外,HStreammg已為用戶提供了更為方便的基于拖拽的可視化接口;在開發(fā)語言方面:S4和Puma均選擇了Java語言;Storm的核心代碼雖然選擇了Clojure語言,但也支持在高可用策略方面:S4和Kafka均選擇了被動等待策略,因此其資源利用率比較低;DataFreewayandPuma選擇了主動等待策略;Storm,TimeStream選擇了上游備份策略,相應(yīng)的資源利用率比較高;Storm,S4,DataFreewayandPuma和Kafka目前均不支持?jǐn)?shù)據(jù)的精確恢復(fù)、負(fù)載均衡等功能,但面向金融領(lǐng)域的StreamBase支持?jǐn)?shù)據(jù)的精確恢復(fù)。

  如5所示,批量計算相關(guān)的大數(shù)據(jù)系統(tǒng),如批量處理系統(tǒng)(如MapReduce)、大規(guī)模并行數(shù)據(jù)庫等,在數(shù)據(jù)吞吐量方面具有明顯優(yōu)勢,但在系統(tǒng)響應(yīng)時間方面往往在秒級以上。而當(dāng)前的流式計算相關(guān)的大數(shù)據(jù)系統(tǒng),如流式處理系統(tǒng)、內(nèi)存數(shù)據(jù)庫、CEP(復(fù)雜事件處理)等,在系統(tǒng)響應(yīng)時間方面雖然維持在毫秒級的水平,但數(shù)據(jù)吞吐量往往在GB級別,遠(yuǎn)遠(yuǎn)滿足不了大數(shù)據(jù)流式計算系統(tǒng)對數(shù)據(jù)吞吐量的要求。通常情況下,一個理想的大數(shù)據(jù)流式計算系統(tǒng)在響應(yīng)時間方面應(yīng)維持在毫秒級的水平,并且數(shù)據(jù)吞吐量應(yīng)該提高到PB級及其以上水平。

  4面臨的技術(shù)挑戰(zhàn)流式大數(shù)據(jù)在實時性、無序性、無限性、易失性、突發(fā)性等方面均呈現(xiàn)出了諸多新的鮮明特征,因此,傳統(tǒng)的先存儲后計算的批量數(shù)據(jù)計算理念不適用于大數(shù)據(jù)流式計算的環(huán)境中,使得大數(shù)據(jù)流式環(huán)境中的數(shù)據(jù)計算在系統(tǒng)的可伸縮性、系統(tǒng)容錯、狀態(tài)一致性、負(fù)載均衡、數(shù)據(jù)吞吐量等方面均面臨著前所未有的新的挑戰(zhàn)。

  4.1可伸縮性在大數(shù)據(jù)流式計算環(huán)境中,系統(tǒng)的可伸縮性是制約大數(shù)據(jù)流式計算系統(tǒng)廣泛應(yīng)用的一個重要因素。Storm,Kafka,TimeStream等系統(tǒng)沒有實現(xiàn)對系統(tǒng)可伸縮性的良好支持:一方面,流式數(shù)據(jù)的產(chǎn)生速率在高峰時期會不斷增加且數(shù)據(jù)量巨大,持續(xù)時間往往很長,因此需要大數(shù)據(jù)流式系統(tǒng)具有很好的“可伸”的特征,可以實時適應(yīng)數(shù)據(jù)增長的需求,實現(xiàn)對系統(tǒng)資源進(jìn)行動態(tài)調(diào)整和快速部署,并保證整個系統(tǒng)的穩(wěn)定性;另一方面,當(dāng)流式數(shù)據(jù)的產(chǎn)生速率持續(xù)減少時,需要及時回收在高峰時期所分配的但目前已處于閑置或低效利用的資源,實現(xiàn)整個系統(tǒng)架構(gòu)和有效的分配,是保障整個系統(tǒng)可伸縮性的基礎(chǔ),同時,又盡可能地減少不必要的資源和能源的浪費(fèi)。

  大數(shù)據(jù)流式計算環(huán)境中的可伸縮性問題的解決,需要實現(xiàn)對系統(tǒng)架構(gòu)的合理布局、系統(tǒng)資源的有序組織、高效管理和靈活調(diào)度,在保證系統(tǒng)完成計算的前提下,盡量少地太久、太多地占用系統(tǒng)資源,通過虛擬化機(jī)制實現(xiàn)軟、硬件之間的低耦合,實現(xiàn)資源的在線遷移,并最終解決大數(shù)據(jù)流式計算環(huán)境中的可伸縮性問題。

  4.2系統(tǒng)容錯在大數(shù)據(jù)流式計算環(huán)境中,系統(tǒng)容錯機(jī)制是進(jìn)一步改善整個系統(tǒng)性能、提高計算結(jié)果的滿意度、保證系統(tǒng)可靠持續(xù)運(yùn)行的一個重要措施,也是當(dāng)前大多數(shù)大數(shù)據(jù)流式計算系統(tǒng)所缺失的。如S4,Puma,Kafka等系統(tǒng)實現(xiàn)了對部分容錯的支持,Storm系統(tǒng)實現(xiàn)了對作業(yè)級容錯的支持,TimeStream系統(tǒng)通過依賴關(guān)系跟蹤實現(xiàn)了對容錯的部分支持。大數(shù)據(jù)流式計算環(huán)境對容錯機(jī)制提出了新的挑戰(zhàn):一方面,數(shù)據(jù)流是實時、持續(xù)地到來,呈現(xiàn)出時間上不可逆的特征,一旦數(shù)據(jù)流流過,再次重放數(shù)據(jù)流的成本是很大的,甚至是不現(xiàn)實的。由于數(shù)據(jù)流所呈現(xiàn)出的持續(xù)性和無限性,也無法預(yù)測未來流量的變化趨勢;另一方面,在流式大數(shù)據(jù)的計算過程中,大部分“無用”的數(shù)據(jù)將被直接丟棄,能被永久保存下來的數(shù)據(jù)量是極少的,當(dāng)需要進(jìn)行系統(tǒng)容錯時,其中不可避免地會出現(xiàn)一個時間段內(nèi)數(shù)據(jù)不完整的情況;再則,需要針對不同類型的應(yīng)用,從系統(tǒng)層面上設(shè)計符合其應(yīng)用特征的數(shù)據(jù)容錯級別和容錯策略,避免不必要的資源浪費(fèi)及應(yīng)用需求的不吻合。

  大數(shù)據(jù)流式計算環(huán)境中的容錯策略的確定,需要根據(jù)具體的應(yīng)用場景進(jìn)行系統(tǒng)的設(shè)計和權(quán)衡,并且需要充分考慮到流式大數(shù)據(jù)的持續(xù)性、無限性、不可恢復(fù)性等關(guān)鍵特征。但是,沒有任何數(shù)據(jù)丟失的容錯策略也未必是最佳的,需要綜合統(tǒng)籌容錯級別和資源利用、維護(hù)代價等要素間的關(guān)系。但在對系統(tǒng)資源占用合理、對系統(tǒng)性能影響可接受的情況下,容錯的精度越高必將越好。

  4.3狀態(tài)一致性在大數(shù)據(jù)流式計算環(huán)境中,維持系統(tǒng)中各節(jié)點(diǎn)間狀態(tài)的一致性對于系統(tǒng)的穩(wěn)定、高效運(yùn)行、故障恢復(fù)都至關(guān)重要。然而,當(dāng)前多數(shù)系統(tǒng)不能有效地支持系統(tǒng)狀態(tài)的一致性,如Storm,Kafka等系統(tǒng)尚不支持維護(hù)系統(tǒng)狀態(tài)的一致性,S4,TimeStream等系統(tǒng)也僅實現(xiàn)了在一定程度上對狀態(tài)一致性的支持。大數(shù)據(jù)流式計算環(huán)境對狀態(tài)一致性提出了新的挑戰(zhàn):一方面,在系統(tǒng)實時性要求極高、數(shù)據(jù)速率動態(tài)變化的環(huán)境中,維護(hù)哪些數(shù)據(jù)的狀態(tài)一致性,如何從高速、海量的數(shù)據(jù)流中識別這些數(shù)據(jù)是一個巨大的挑戰(zhàn);另一方面,在大規(guī)模分布式環(huán)境中,如何組織和管理實現(xiàn)系統(tǒng)狀態(tài)一致性的相關(guān)數(shù)據(jù),滿足系統(tǒng)對數(shù)據(jù)的高效組織和精準(zhǔn)管理的要求,也是一個巨大的挑戰(zhàn)。

  大數(shù)據(jù)流式計算環(huán)境中的狀態(tài)一致性問題的解決,需要從系統(tǒng)架構(gòu)的設(shè)計層面上著手。存在全局唯一的中心節(jié)點(diǎn)的主從式架構(gòu)方案無疑是實現(xiàn)系統(tǒng)狀態(tài)一致性的最佳解決方案,但需要有效避免單點(diǎn)故障問題。通常情況下,在大數(shù)據(jù)流式計算環(huán)境中,程序和數(shù)據(jù)一旦啟動后,將會常駐內(nèi)容,對系統(tǒng)的資源占用也往往相對穩(wěn)定。因此,單點(diǎn)故障問題在大數(shù)據(jù)流式計算環(huán)境中并沒有批量計算環(huán)境中那么復(fù)雜。批量計算環(huán)境中的很多策略將具有很好的和借鑒價值。

  4.4負(fù)載均衡在大數(shù)據(jù)流式計算環(huán)境中,系統(tǒng)的負(fù)載均衡機(jī)制是制約系統(tǒng)穩(wěn)定運(yùn)行、高吞吐量計算、快速響應(yīng)的一個關(guān)鍵因素。然而,當(dāng)前多數(shù)系統(tǒng)不能有效地支持系統(tǒng)的負(fù)載均衡,如Storm,S4等系統(tǒng)均不支持負(fù)載均衡機(jī)制,Kafka系統(tǒng)實現(xiàn)了對負(fù)載均衡機(jī)制的部分支持:一方面,在大數(shù)據(jù)流式計算環(huán)境中,系統(tǒng)的數(shù)據(jù)速率具有明顯的突變性,并且持續(xù)時間往往無法有效預(yù)測,這就導(dǎo)致在傳統(tǒng)環(huán)境中具有很好的理論和實踐效果的負(fù)載均衡策略在大數(shù)據(jù)流式計算環(huán)境中將不再適用;另一方面,當(dāng)前大多數(shù)開源的大數(shù)據(jù)流式計算系統(tǒng)在架構(gòu)的設(shè)計上尚未充分地、全面地考慮整個系統(tǒng)的負(fù)載均衡問題,在實踐應(yīng)用中,相關(guān)經(jīng)驗的積累又相對缺乏,因此,給大數(shù)據(jù)流式計算環(huán)境中負(fù)載均衡問題的研究帶來了諸多實踐中的困難和挑戰(zhàn)。

  大數(shù)據(jù)流式計算環(huán)境中的負(fù)載均衡問題的解決,需要結(jié)合具體的應(yīng)用場景,系統(tǒng)地分析和總結(jié)隱藏在大數(shù)據(jù)流式計算中的數(shù)據(jù)流變化的基本特征和內(nèi)在規(guī)律,結(jié)合傳統(tǒng)系統(tǒng)負(fù)載均衡的經(jīng)驗,根據(jù)實踐檢驗情況,不斷進(jìn)行相關(guān)機(jī)制的持續(xù)優(yōu)化和逐步完善。

  4.5數(shù)據(jù)吞吐量在大數(shù)據(jù)流式計算環(huán)境中,數(shù)據(jù)吞吐量呈現(xiàn)出了根本性的增加。在傳統(tǒng)的流式數(shù)據(jù)環(huán)境中,如CEP,所處理的數(shù)據(jù)吞吐量往往在GB級別,滿足不了大數(shù)據(jù)流式計算環(huán)境對數(shù)據(jù)的吞吐量的要求。在大數(shù)據(jù)流式計算環(huán)境中,數(shù)據(jù)的吞吐量往往在TB級別以上,且其增長的趨勢是顯著的。然而,當(dāng)前流式數(shù)據(jù)處理系統(tǒng),如Storm,S4等,均無法滿足TB級別的應(yīng)用需求。

  大數(shù)據(jù)流式計算環(huán)境中的數(shù)據(jù)吞吐量問題的解決,一方面需要從硬件的角度進(jìn)行系統(tǒng)的優(yōu)化,設(shè)計出更符合大數(shù)據(jù)流式計算環(huán)境的硬件產(chǎn)品,在數(shù)據(jù)的計算能力上實現(xiàn)大幅提升;另一方面,更為重要的是,從系統(tǒng)架構(gòu)的設(shè)計中進(jìn)行優(yōu)化和提升,設(shè)計出更加符合大數(shù)據(jù)流式計算特征的數(shù)據(jù)計算邏輯。

  5結(jié)論流式大數(shù)據(jù)作為大數(shù)據(jù)的一種重要形態(tài),在商業(yè)智能、市場營銷和公共服務(wù)等諸多領(lǐng)域有著廣泛的應(yīng)用前景,并已在金融銀行業(yè)、互聯(lián)網(wǎng)、物聯(lián)網(wǎng)等場景的應(yīng)用中取得了顯著的成效。但流式大數(shù)據(jù)以其實時性、無序性、無限性、易失性、突發(fā)性等顯著特征,使得其與傳統(tǒng)批量大數(shù)據(jù)在數(shù)據(jù)計算的要求、方式等方面有著明顯的不同,也使得當(dāng)前諸多數(shù)據(jù)計算系統(tǒng)無法進(jìn)一步更好地適應(yīng)流式大數(shù)據(jù)在系統(tǒng)可伸縮性、容錯、狀態(tài)一致性、負(fù)載均衡、數(shù)據(jù)吞吐量等方面所帶來的諸多新的技術(shù)挑戰(zhàn)。

  本文從大數(shù)據(jù)環(huán)境中流式數(shù)據(jù)的特征切入,以大數(shù)據(jù)流式計算架構(gòu)的設(shè)計、優(yōu)化和挑戰(zhàn)為核心,系統(tǒng)地梳理和分析了當(dāng)前大數(shù)據(jù)環(huán)境中的關(guān)于大數(shù)據(jù)流式計算系統(tǒng)的研究和發(fā)展現(xiàn)狀,從系統(tǒng)架構(gòu)的角度分析了一個設(shè)計優(yōu)良的大數(shù)據(jù)流式計算系統(tǒng)應(yīng)該在系統(tǒng)結(jié)構(gòu)、數(shù)據(jù)傳輸、應(yīng)用接口、高可用技術(shù)等諸多關(guān)鍵技術(shù)上進(jìn)行優(yōu)化。同時,本文詳細(xì)地分析和對比了當(dāng)前在實踐中具有很好的應(yīng)用基礎(chǔ)、較為典型的5款大數(shù)據(jù)流式計算系統(tǒng),并具體闡述了大數(shù)據(jù)流式計算在系統(tǒng)的可伸縮性、系統(tǒng)容錯、狀態(tài)一致性、負(fù)載均衡、數(shù)據(jù)吞吐量等方面所面臨的新的挑戰(zhàn),實現(xiàn)了對流式大數(shù)據(jù)環(huán)境中數(shù)據(jù)計算架構(gòu)、關(guān)鍵問題及其技術(shù)挑戰(zhàn)的深入研究。

  可以看出,大數(shù)據(jù)流式計算的研究和應(yīng)用仍處于很不成熟的階段,這與其廣泛的市場需求和應(yīng)用前景很不吻合。為了促進(jìn)大數(shù)據(jù)流式計算的成熟、穩(wěn)健發(fā)展,亟待全面、系統(tǒng)、深入地開展相關(guān)理論和實踐的研究工作。

  在未來的研究工作中,將進(jìn)一步深化對大數(shù)據(jù)流式計算架構(gòu)及其關(guān)鍵技術(shù)的研究,并結(jié)合詳細(xì)的應(yīng)用需求,開發(fā)、部署、測試并優(yōu)化面向特定應(yīng)用領(lǐng)域的大數(shù)據(jù)流式計算系統(tǒng),進(jìn)一步推動大數(shù)據(jù)流式計算理論、方法、技術(shù)與系統(tǒng)的研究與發(fā)展。

作者:佚名  來源:中國潤滑油網(wǎng)

 

    主站蜘蛛池模板: 欧美疯狂xxxx乱大交| 国产怡春院无码一区二区| 又黄又硬又湿又刺激视频免费| 亚洲无线看| 久久久久久欧美精品se一二三四| 边舌吻一边揉着胸扒衣服| 亚洲国产激情五月色丁香小说 | 无码人妻一区二区三区一| 一区二区三区在线视频免费| 国产在线无遮挡免费观看 | 91热热热| 老师解胸罩喂我吃奶| 奇米综合四色77777久久| 阿v天堂在线观看| 亚洲午夜国产精品无码老牛影视| 伊人久久青草| 亚洲欧美自偷自拍| 调教驯服丰满美艳麻麻在线视频| 亚洲精品一区二区丝袜图片| 亚洲国产日韩一区二区三区| 欧美a一区二区三区| 亚洲19p| 日本不良视频| 成午夜精品一区二区三区软件| 好爽快一点高潮了| 欧美成ee人免费视频| 人人干狠狠干| 男插女动态| 羞羞午夜福利免费视频| 国产在线看片| 国产在线精品一区二区在线观看| 青娱乐国产精品| 97热在线| 国产成人手机在线| 日韩精品综合一本久道在线视频| 久久精品国产久精国产爱| 91精品国产自产| 亚洲双插| 色国产在线视频| 日本中文一区二区三区亚洲| 成人黄色国产| 在线āv视频| 伊人伊色| 国产69精品久久99不卡| 18我禁在线观看| 亚洲精品久久久久一区二区| 波多野结衣久久精品| 992人人草| 特黄aaaaa作爱毛片4| 捆绑一区二区三区| 精品少妇无码av无码专区| 国产精品免费观看网站| 日韩中文字幕中文无码久本草| a猛片在线观看| 日韩制服丝袜av| 无码av中文字幕免费放| 亚洲私人影院在线观看| 欧美tv色播影院| 青娱乐在线播放| 全国最大色| av中文字幕在线观看第一页| 爱爱综合网| 婴尸在线观看免费高清恐怖| 欧美7777| 韩国av免费在线| brandilove欧美三区| 天天躁日日躁狠狠躁图片swag | 亚洲国产精品久久久久婷婷老年| 亚洲日本在线播放| fc2ppv在线观看| 国产免费不卡午夜福利在线 | 国产精品magnet| 国产精品久久艹| 射黄视频| 美女黄色漫画| 6699嫩草久久久精品影院软件| 任你躁免费精品视频2538国内| 黄色毛片视频校园交易| 求个在线色播影院| 亚洲精品欧美综合网| 91蜜桃网| 国产福利视频一区| 激情av在线播放| 亚洲无人区一区| 一本久道中文字幕精品亚洲嫩| 国产精品91久久久久久| 97caocao| 超薄丝袜连裤袜一二三区福利| 国产一区二区三区久久久久久| 欧日韩视频| 亚洲伦伦在线| 亚洲精品人人| 亚洲欧美综合精品久久成人| 一本岛在线视频| 欧美色图13p| 国产 日韩 中文字幕 制服| 在线日韩日本国产亚洲| 爱爱视频一区| 国产三级三级三级看三级| 九九99亚洲精品久久久久| 2019天天干天天操| 日本成人动态图| 亚洲成a人无码亚洲成www牛牛| 欧美裸体精品| 人体久久天天| 免费黄色av| 艹男人的日日夜夜| 国产乱xxⅹxx国语对白| 美女被草出水| 国产亚洲成人精品| www.午夜激情| 深夜福利亚洲| 色成网| 2018年亚洲欧美在线v| 丝袜综合网| 欧美精品不卡| 国产精品对白久久久久粗| 久久电影网站中文字幕| 成人无码免费视频在线播| 日本丰满bbwbbw厨房| 少妇无套内谢少妇在线播放| 国产精品免费一区二区三区四区 | a级免费毛片| 美女黄网站18禁免费看| 男女在线观看视频| 国产精品久久久久久久久久尿| 日本www.在线中文字幕| 黄色高清免费| 亚洲成人aaaa| 欧美成人手机视频| 国外xxx性直播免费| 日韩视频免费在线观看| 国产成人三级在线观看视频| 在线免费观看的av| 美女被cao在线观看| 久久精品亚洲国产av老鸭网| 中文字幕在线不卡国产视频| 欧美日韩高清不卡| 中国少妇高潮| 成人激情av| 精品偷拍一区二区三区在线看| 337p人体色噜噜噜狠| 欧美变态视频| 精品中文字幕在线| 亚洲一二三区在线观看| 97色国产| 在线观看91视频| 一区二区激情日韩五月天| 国产久一| 新呦u视频一区二区| 手机看片福利日韩| 久草网免费在线观看| 欧美白丰满老太aaa片| 国产成人亚洲欧洲| 中文字幕一区二区三区久久| 欧美深度肠交惨叫| 日本午夜精品一区二区三区| 97性潮久久久久久久久| 欧美大尺度做爰床戏| 天天躁夜夜躁狠狠综合| 羞羞网站大全| 熟女乱色一区二区三区| 国产精品毛片| 免费大香伊蕉在人线国产卡| 午夜影院免费观看视频| 忘忧草社区在线播放日本韩国| 91 电影在线观看| 欧美美女做受| 国产亚洲欧洲日韩在线...| 欧美一区二区三区网站| 韩国美女vip内部1101免费| 麻豆精品免费| 免费在线看视频| 偷看美女洗澡一二三四区| 男女午夜视频| 国内精品自国内精品66j影院 | 视频在线观看免费大片| 国产精品美女www爽爽爽视频| 区产品乱码芒果精品综合| 欧美亚洲免费观看| 国产精品亚洲a∨天堂| 亚洲欧美日韩第一区| a在线视频v视频| 日日操综合| 日韩 av 免费看| 四虎影院新地址| 欧美伦费免费全部午夜最新| 美女网站黄页| 亚洲午夜久久久无码精品网红a片| 中国肥老太婆高清video| 一本之道av| 欧美xxxⅹ性欧美大片| 亚洲久草| 亚洲一区二区福利| 18禁无遮挡羞羞啪啪免费网站| 国产一区二三区好的| 欧洲av一区二区三区| 少妇高潮惨叫喷水正在播放| 久久出品| 亚洲欧美资源在线| 国产亚洲欧美精品一区| 国产97自拍| 理论片黄色| 香蕉国产片| 男欢女爱久石| 国语对白做受xxxxx在线中国| 日韩亚洲在线| 日韩高清一级| 人妻无码中文久久久久专区| 国产传媒免费视频| 黄色福利网站| 中文字字幕第183页| 欧美激情麻豆| 激情综合网五月天| 日本香蕉视频在线观看| 欧美日韩亚洲不卡| 国产乱老熟视频网88av| 在线a视频免费观看| 天天爽夜夜爽夜夜爽精品| 亚洲自偷自偷图片高清| 日韩精品美女| 中文字幕丰满孑伦无码精品| 91成人久久| 精品国产网| 1769偷拍在线视频免费蜜桃| 新老司机在线视频观看免费| 亚洲精品社区| а√天堂8资源中文在线| 国产区精品福利在线社区| 国产精品影音| 日韩欧美一区二区三区在线观看| 伊人大杳焦在线| 国产一级做a爰片久久| 午夜影院0606免费| 久久嫩草精品久久久精品才艺表演| 草莓巧克力香氛动漫的观看方法 | 美女粉嫩饱满的一线天mp4| 九九热免费视频| 中文字幕成熟| 玖草视频在线观看| 91免费黄视频| 亚洲人成精品久久久久| 天堂一区一卡二卡视频| 在线亚洲一区二区| 国产成人一区二区三区在线| 毛片网站毛片网站| 夜夜夜夜夜猛噜噜噜噜噜gg| 日本精品二区| 久久与欧美| 两根黑粗一起进3p夜夜嗨av| 亚洲日本一区二区三区在线不卡| 久久久久久久97| 亚洲国产精品视频一区| 欧美高清视频一区二区三区| 天天干天天澡| 99草在线视频| 日韩美女视频在线| 美女又爽又黄视频| 久九九精品免费视频| 日韩xxxxxxxxx| 性色av无码中文av有码vr| 真实的国产乱xxxx| 久久久无码精品亚洲日韩电影| 奇米国产| 2022国产成人精品视频人| 日本欧美专区| 无码国产色欲xxxx视频| 九色综合国产一区二区三区| 中国精品少妇| 亚洲视频男人的天堂| 亚洲二区三区四区| 污视频免费网站| 玩成熟老熟女视频| 久久久精品妇女99| 青青河边草新视频| 久久99久久久| 男女啪网站| 国产成人无码精品久久久小说 | 欧美日韩不卡视频| 成人午夜视频网站| 亚洲超碰97人人做人人爱| 国产精品入口尤物| 黄色片高潮| 欧美日本高清在线不卡区| 狍与女人做爰的视频| 亚洲一卡2卡新区国色天香| 国精品无码人妻一区二区三区| 亚洲成av人片在一线观看| 丝袜一区二区小说| 欧美99视频| 欧洲丰满少妇做爰视频爽爽| 天天操夜夜逼| 99热这里只有精品1| 久久综合一区二区三区| 精品欧美久久久| 在线无码午夜福利高潮视频| 免费av片在线观看一道本| 成人无码视频| 日本一卡精品视频免费| 中文字幕人妻互换av久久| 日韩欧美三级在线| 久久婷五月综合| 一区二区三区不卡视频| 欧美一区二区三区成人久久片| 日本大胆在线观看| 国产教师av| 欧美日韩系列| 久久深夜视频| 日韩精品区| 日韩国产色| 四虎影视在线永久免费观看| 亚洲永久国产精品| 亚洲播放在线| 亚洲精品自产拍在线观看动漫| 2020国产精品午夜福利在线观看 | www成人免费视频| 日韩小视频在线播放| 狠狠躁18三区二区一区ai明星| 2020国产成人综合网| 亚洲欧美日韩中文无线码| av激情影片免费看| 国产sm调教折磨视频| 欧美精品一区二区精品网| 亚洲国产av精品一区二区蜜芽| a级网站在线观看| 新超碰97| 国产a级黄| 激情视频成人| 久热精品青草| 你懂的福利网站| 久久久久久激情| 无遮挡又黄又爽的视频| 色国产在线观看| 亚洲中文波霸中文字幕| 欧美韩国日本在线观看| 久久99精品久久久久久国产越南| 国产又粗又大又黄| 国产高潮刺激叫喊视频| 黑粗硬长欧美在线视频免费的| 亚洲的vs日本的vs韩国| 国产性色强伦免费视频| 黄色大片网| 久久夜夜| 一级片avav网址| 欧美第一区第二区| 黄色精品在线看| 国产女av| 综合亚洲自拍| 欧美精品videos性欧美| 欧美bdsm另类区| 男女草草草| 日韩一| 成人久久av| 欧美黑人性猛交| a级在线观看| 香港三日本三级少妇三级视频| 国产成人综合亚洲看片| 干干干操操操| 亚洲国产美女久久久久| 一区一区三区产品乱码| 国产亚洲精品久久精品6| 精品一卡二卡三卡| 国产精品爽爽久久久久久| 亚洲精品在线观看免费视频| 国产三级精品三级在线专1| 五月天国产一区| 国产又大又粗又硬| 欧美福利视频一区二区| 国产黄色在线| 蜜臀久久精品久久久久| 亚洲国产欧洲综合997久久| 激情五月婷婷网| 国产日韩欧美电影在线观看| 99热门精品一区二区三区无码 | 亚洲一区二区欧美日韩| 正在播放亚洲| 日本在线成人| 91精品国产99| 午夜久久网站| 欧美日韩在线网站| 天天色成人网| 午夜久久国产| 国产疯狂伦交大片| 丁香婷婷社区| 中文字幕亚洲码在线观看| 精品亚洲a∨| 羞羞影院午夜男女爽爽免费视频| 2021最新国产在线人成| 秋霞午夜av一区二区三区| 中文精品无码中文字幕无码专区| 蜜臀av夜夜澡人人爽人人桃色| 精品少妇v888av| 日韩中文免费| 免费观看黄色a一级爱做视频 | 久久国产36精品色熟妇| 中文字幕一区二区中文字幕| 国产精品自在拍首页视频| 一卡二卡3卡四卡网站精品| 泽村玲子作品在线播放| 国产一区深夜福利| 亚洲综合色丁香婷婷六月图片| 天堂资源中文在线| 九九黄色大片| www.国产网站| 国产精品最新在线观看| 国模私拍大尺度裸体av| 天天综合天天做天天综合| 国产刺激视频| 日韩成人在线视频观看| 日本xxxxxxx免费视频| 久久99网站| 久久精品www人人爽人人| 麻豆视传媒精品av在线| 一级国产航空美女毛片内谢| 国产男女猛烈无遮挡在线喷水| 欧美人与物videos另类xxxxx| 日韩精品第一区| 黄色aaaaaa| 少妇无套内谢在线播放| 7799精品天天综合网| 亚洲av乱色毛片色戒秋霞| 综合精品在线| 动漫精品专区一区二区三区不卡| 国产极品白嫩精品| 老师扒开双腿让我桶| 久爱视频在线| 色天天天综合色天天| 污网站无遮挡| 69成人网| 青青草视频国产| 人妻av资源先锋影音av资源 | 欧美国产综合色视频| 特级全黄大片| 国产视频一区二区| 日韩免费无砖专区2020狼 | 国产宅男在线观看| 无码h片在线观看网站| 少妇色av| 欧美日韩国产首页| 黄色网在线免费观看| 亚洲一区二区三区在线观看精品中文| 国产午夜小视频| 涩涩视频在线观看| 婷婷综合网入口| 欧美黄色动态图| 久久免费少妇| 女生被艹在线观看| 久久黄色片| av无码国产在线看免费网站| 午夜久久久影院| 成人三级av| 日韩欧美在线观看免费| 国产av国片偷人妻麻豆| 一级黄色影视| 美女100%无遮挡网站| 欧美性免费| 大尺度av在线| 日韩成人在线一区| 久久日本视频| 乱码精品一卡二卡无卡| 日本黄色播放器| 午夜激情一区| 亚洲国产小视频| 丰满爆乳在线播放| 国产97色在线 | 免| 日本久久综合网| 国产综合亚洲区在线观看| av一区二区三区免费观看| 五月丁香色综合久久4438| 久草在线观看福利视频| 国产精品美女主播在线观看纯欲| а√天堂www在线а√天堂视频| 激情综合网站| 999这里有精品| 国产一区二区在线观看免费视频| 美女91作爱视频| 99欧美视频一区二区国产| 韩国无码av片在线观看网站| 96精品| a中文在线天堂| 99精品桃花视频在线观看| 欧美激情第一页xxx| 欧美大片高清免费看| 中文字幕免费在线视频| 国产网站黄色| 国产手机在线精品| 一区二区三区午夜免费福利视频| 天天做日日做天天添天天欢公交车| 色综合久综合久久综合久鬼88| 国产精品23p| 精品中文在线| 成人免费av网站| 免费人成视网站在线不卡| 欧美黑人精品| 亚洲一级性| av中文资源在线资源免费观看| 日日色视频| 国产欧美一区二区三区免费视频| 女人黄色免费| 国产福利第一视频| 丝袜诱惑福利视频| 新天堂av| 国产国拍精品av在线观看| 很污的网站| 在线观看成人年视频免费| 亚洲 欧美 日韩 在线| 欧美综合自拍亚洲综合图片区| 国产在线国偷精品产拍免费yy| 欧美久久99| 99久e在线精品视频在线| 亚洲乱码一区av黑人高潮| 色噜噜狠狠一区二区| 日本黄色a级片| 亚洲婷婷天堂| 免费黄色在线| 四虎国产精品成人免费久久| 手机亚洲第一页| 亚洲精品国产一区二区三区四区在线| 成人综合伊人五月婷久久| 中文字幕日本乱码仑区在线| 欧美大阴口| 国产成人理论在线观看视频| 亚洲一区成人在线| 国模套图日韩精品一区二区| 4虎最新| 国产主播区| 国产高清网站| 日韩欧美视频二区| 无码国产偷倩在线播放老年人| 国产成人午夜精品影院观看视频| 最新日韩精品| 超清纯白嫩大学生无码网站| 鞭打哭着求饶吊调教惩罚| www.97色| 国产成人av在线播放不卡| 爱爱网站免费观看| 国产男男gay体育生白袜| 三级精品在线观看| 国产一区午夜| 国产精品未满十八禁止观看| 亚洲四虎在线| 国产青草视频| 一级特黄录像免费观看| 香港三级日本三级韩级人妇| 懂色av一区二区夜夜嗨| 久久久婷婷一区二区三区不卡| www.操操操.com| 久久精品视频12| 激情综合色五月六月婷婷| 亚洲精品suv精品一区二区| 久久久久久久久久久久久影院| 一区二区国产露脸在线播放| 久久视频一区| 在线观看免费国产小视频| 国产欧美一区二区精品性色| 就去色av| 乱色欧美videos黑人69| 欧美系列日韩一区| 99re久| 88久久精品无码一区二区毛片 | 亚洲欧洲日韩精品| 嫩草影院在线入口| 男女男精品视频网| 久久久99精品免费观看| 国产韩国精品一区二区三区| 午夜激情亚洲| 欧美网站在线看| 麻豆国产av穿旗袍强迫女佣人| 999精品网站| 成人毛片在线播放| 97超视频免费观看| 美女的肌肌让男的捅免费视频| av伦理在线| 91av在线网站| 97av在线播放| 国产片免费福利片永久| 足踩馆sm免费踩踏社区视频vk| 免费日韩在线视频| 黑人狂躁日本妞hd| 少妇人妻中文字幕hd| 久久99国产只有精品| 免费久久人人爽人人爽av| 亚洲日韩av片在线观看| 性国产牲交xxxxx视频| 国产精品久久久久精k8| 国产精选视频| 丁香婷婷在线观看| 午夜剧场视频| 越南美女毛茸茸| 91mv.cool在线播放| 免费在线播放毛片| 色爱成人综合| 欧美一区二区三级| 这里有精品| 91精品成人| 日美av| 国产新婚疯狂做爰视频| 在线一区二区日韩| 国产精品无人区一区二区三区| 精产国品一二三产区9977| 91性色| 妞干网免费在线| 午夜国产精品一区二区三区| 狠狠色狠狠色综合系列| 欧美欲色| 国产尤物视频在线| 在线黄色av| 欧美国产日韩一区二区在线观看| 激情av资源网| 男女动态视频全过程| 免费不卡亚洲欧美| 韩国三级国产| 成年人性生活免费视频| 丰满人妻熟妇乱又伦精品软件| 亚洲人av在线| www.激情小说.com| 久久99精品久久久影院老司机 | 欧美色蜜桃97| 一级黄色录相| 国产在线无码视频一区| 侵犯视频无遮挡| 男人插女人下面视频在线观看| 激情视频在线高清看| 日韩黄色碟片| www.日本com| 亚洲欧洲无卡二区视頻| 操比网站| 国产在线一二三四区| 欧美亚洲在线视频| 国产精品一区二区av日韩在线| 漂亮人妻洗澡被公强 日日躁 | 精品一区二区三区视频在线观看| 免费看男人添女人无遮挡| 国产又粗又猛又爽又黄91| 国产精品久久久久久av福利软件| av不卡播放| 美女污软件| 婷婷丁香狠狠爱| 黄色av视屏| 欧美日韩综合在线| 国产www精品| 久草在线费播放视频| 三上悠亚久久| 男生和女生差差视频| 久久草av| 色天天综合久久久久综合片| 91桃色欧美| 中文在线资源| 九九九九网站| 性av+色av| 小桃酱精品一区二区三区在线| 妞干网在线免费视频| 亚洲第一av网| 德国艳星videos极品hd| 亚洲乱码中文字幕手机在线| 在线免费日韩av| 亚洲黄在线| 人人艹人人爱| 中文天堂在线资源www| 日本美女激情视频| 日韩在线精品强乱中文字幕| 久爱精品视频在线播放 | 天天狠天天天天透在线| 精品一二三四五区| 精品国产麻豆免费人成网站| 久久视热这里只有精品| 午夜国产理论片| 一本精品999爽爽久久久| 毛片a级免费| 艳z门照片无码av| 国产精品成人在线观看| 狠狠躁夜夜躁人人爽超碰97香蕉| 91精品国产91久久久久青草| 欧洲视频一区二区| 中文字幕_第3页_高清免费在线| 中文字幕亚洲欧美日韩2019 | 性生活三级视频| 男女做爽爽爽视频免费软件| 国产日韩中文字幕在线| 99国产成人综合久久精品欧美| 国产精品成人av片免费看最爱| 亚洲女初尝黑人巨| 日韩av中文字幕在线免费观看| 欧美日本网站| 视频一区 中文字幕 精品| 国产精品害羞卫校小美女图片 | 久久精品久久精品久久| 女女les互磨高潮电影| 亚洲欧美另类在线图片区| 99热国内精品永久免费观看| 色婷在线| 任务待续高清在线观看| 四虎官网| 久操视频在线免费观看| 9l视频自拍蝌蚪9l视频在线看| 国内精品亚洲| 色女仆在线影院| 夜夜操夜夜爱| 国产精品se| 国产小便视频在线播放| 欧美成人va免费看视频| 亚州av成人| 欲色影视综合吧| 一区二区xxx| 最近最新中文字幕视频| 琪琪午夜伦理| 国产私拍精品| 99re| www.国产在线| 欧美成人www在线观看| 国内精品久久久久久无码不卡| 国产成a人无v码亚洲福利| 在线观看视频二区| 乌克兰美女av| 综合欧美亚洲日本一区| 欧美日韩亚洲三区| 色多多www视频在线观看免费| 福利视频少妇同事| 日韩国产图片区视频一区| 激情午夜网站| 亚洲一区二区免费看| 国产69精品久久久久人妻刘玥| 性生交大片免费全视频| 中文 日韩 欧美| 99亚洲综合成人精品久久久| 精品制服美女丁香| 一二三四韩国视频社区3| 朴银狐电影中文在线看| 777奇米美女| 人人澡人人射人人爱| 人妻熟女一区二区aⅴ千叶宁真| 天堂成人av在线| 久久视频国产| 亚洲va中文字幕无码久久| 日本做受高潮好舒服视频 | 青青青国内视频在线观看软件| 日本午夜精品一区二区三区电影 | 日本高清免费播放| 一级淫片15秒| 亚欧aⅴ天堂在线| 国产另类ts人妖一区二区| 国产成人久久精品77777综合| 国产精品久久ai| 9色国产深夜内射| 亚洲欧美经典视频| 麻豆视频在线观看| 久久国产精品一区二区三区| 久久综合入口| 亚洲性图av| 久久动漫av| 日韩a片无码一区二区五区电影| 欧美日本免费| 亚洲国产精品无码久久秋霞| 99操视频| 一级黄色影院| 欧美黄色小说| 99久久精品免费观看| av在线入口| 热99在线观看| 色综合婷婷| 亚洲少妇综合| 中文天堂网| 看黄a大片爽爽影院免费无码| 久久久xxx| 另类小说视频| 成人动漫亚洲| 国产69精品久久久久久久| 国产一区二区三区视频免费| 国产香蕉av| 网站黄色在线免费| 国产啊v在线| 日本a级片在线播放| 精品久久久一区| 开心激情小说网| 亚洲精品久久久中文| 天堂成人av| 99精品国产自在现线10页| 星空大象在线观看免费播放| 欧美激情第四页| 男女做受视频| 91av在线网站| 特级黄色片| 亚洲色图视频网站| 污的视频在线观看| 国语偷拍视频| 999zyz玖玖资源站永久| aⅴ网站在线观看| 产无套精品一线二线三线| 暖暖 在线 日本 免费 中文| 国产尤物精品福利视频| 国产在线无码一区二区三区视频| 欧美一级做a爰片久久高潮| 欧美一区二区三区视频在线观看| 最激烈的床震娇喘视频出水| av男人毛片在线播放| 免费色漫在线| 99re| 欧美黄污视频| 好看的毛片网站| 护士的奶头又大又白又好摸| 亚洲夜夜爱| 国产91丝袜| 婷婷久久综合九色综合97最多收藏| 日韩性色视频| jzzijzzij亚洲成熟少妇| 日本日本乱码伦专区| 午夜寂寞少妇aaa片毛片| 精品国产高清自在线一区二区| 国产一区二区成人| 韩国午夜激情| 97超碰在| 国产精品1区| 免费激情av| 亚洲无线一二三四区手机| 日韩成人手机在线| 五月天婷婷视频| 69a∨色欧美丰满少妇| 欧美最大胆的西西人体44| 欧美乱轮视频| 性久久久久| 欧美多p| 性生交大片免费观看4| 亚洲精品无码专区在线观看| 久久久久久久久久码影片| 自拍 亚洲 欧美| 色综合天天狠 天天透天天伊人| 日本不卡一区| h中文字幕| 自拍偷拍亚洲| 黄网在线观看免费网站| 免费看污污视频| 欧美精品入口| 国产美女裸身网站免费观看视频| 国99精品无码一区二区三区| 超碰在线综合| 班里男生舔我下面的视频| 午夜在线网站| 久久尤物视频| 国产人成免费视频| 52永久免费看mv网站入口| 中国美女一级黄色片| 成人在线大片| 精彩毛片视频| 男女涩涩视频| 亚洲精品国产美女在线一区| 色中色综合网| 黄色三级日本| 精品黄网站| 黄色成人毛片| 自拍视频国产| 狠人婷婷综合亚洲精品亚洲| 久久久久爽人综合网站| 日韩黄在线| 午夜桃色| 九九影院理论片私人影院| 日韩大片在线观看视频| 日韩小视频| 午夜性伦鲁啊鲁免费视频| 羞羞的软件| 亚洲欧洲成人在线| 男人操女人动态图| 把女邻居弄到潮喷的性经历| 久久综合一色综合久久小蛇| 欧美色偷| 久久久精品国产一二三产区区别| 免费的又色又爽又黄的片捆绑美女| 亚洲精品第一国产综合精品99| 成年人福利视频| 久久999热| 999久久久精品视频| 久久久久久久久久久网站| 国产第一草草影院 | 99精品视频在线在线观看视频| 久久99热全是成人精品| 亚洲综合男人的天堂| 青青青国产依人在线| 日韩av一卡二卡| 日韩成人专区| 国产精品色综合精品福利在线| 美女免费看片| 少妇高潮久久久久久一代女皇| 日韩有码 在线视频| 91综合在线观看| 一级黄色特级片| 亚洲人妖av一区二区| 无码 人妻 在线 视频| 亚洲精品精选| 337p日本欧洲亚洲大胆在线| 337p粉嫩大胆色噜噜噜| 啪啪69xxⅹ偷拍| 三级三级三级a级全黄公司的| 精品国产免费观看| 国产最新在线观看| 欧美综合站| 奇米色五月| 幸福宝污| 国产三级日韩| 日本aⅴ亚洲精品中文乱码| 蜜桃久久久久久久| www.伊人.com| 99精品欧美一区| 蜜臀91av| 成在线人av无码高潮喷水 | 免费在线观看的av网站| 日本中文字幕高清| 人妻中文字幕乱人伦在线| 日本中文字幕免费| 殴美一级黄色片| 国产在线观看污片| 四虎影视永久免费观看在线| 日本裸体色图| 新中文字幕| 欧洲熟妇色xxxxx视频| 亚洲国产aⅴ精品一区二区三区| 天天躁日日躁狠狠躁| 欧美牲交a欧美牲交aⅴ| a√视频在线观看| 365夜爽爽欧美性午夜免费视频| 欧美成人va免费看视频| 5252aⅴhaose我爱久久| 九九九精品成人免费视频小说| 亚洲欧美福利| 中文字幕黄色av| 国产裸体美女永久免费无遮挡| 激情六月综合| 日韩精品在线播放视频| 日韩顶级片| 娇妻被交换粗又大又硬 产品视频| 99re久久精品国产| 簧片在线免费看| 欧美粗又大| 日韩你懂得| 黑人又粗又大xxx精品| 亚洲在线免费av| 亚洲精品自偷自拍无码忘忧| 国产成人综合精品三级| 黄色片视频观看| 伦理片中文字幕| 国产野模私拍在线视频| 亚洲视频无码高清在线| av作品在线观看| 国产在线有码| 日韩精品一区二区三| 色丁香色婷婷| 99精品视频中文字幕| 午夜福利视频合集1000| 国产美女亚洲精品久久久综合| 亚洲激情专区| 无码国产精品一区二区av| 亚洲自拍色| 中文字幕精品av| 亚洲视频一级| 国产成人啪精品午夜小说| 日韩精品免费在线视频观看| 久久国产视频精品| 亚洲国产综合精品中文第一| 三区视频播放观看在线| 日本护士被弄高潮视频| 亚洲ty| 免费嫩模在线观看视频| 日本xxxx在线播放| 亚洲蜜桃妇女| 青青草这里只有精品| 免费日韩在线| 亚洲国产人成自久久国产| 深夜中文字幕| 青青草超碰| 上司侵犯一区二区中文字幕 | 亚州激情视频| 亚洲免费一二三区| 久久九九有精品国产| 亚洲一本在线观看| 国产露脸精品爆浆视频| 成人亲热视频网站| 精品97国产免费人成视频| 小视频国产| av激情天堂| 亚洲午夜福利精品久久| 免费视频无遮挡在线观看| 国产免费人成视频在线播放播| 国产另类ts人妖高潮| 潮喷大喷水系列无码视频| 天天影视网色香欲综合网| 久久久伊人欧美| 免费成人在线视频网站| 日韩av无码精品一二三区| 久久九精品| 五月综合激情| 日本一区二区三区免费视频| 青青爽在线视频| 欧美日韩在线精品一区二区三区| 五月婷婷免费| www日本com| 一区二区三区在线视频看| 中文字幕_第3页_高清免费在线| 精品国产人妻一区二区三区免费| 黄色在线网站| 亚洲免费中文字幕| 中文精品久久久久国产网址|