網站首頁 教育 學前教育 精緻生活 飲食養生 命理 科普教育 金融 歷史 影視 數碼 熱門資訊
當前位置:生活百科站 > 精緻生活 > 

大資料技術包括哪些

欄目: 精緻生活 / 釋出於: / 人氣:5.52K
大資料技術包括哪些

大資料技術包括資料收集、資料存取、基礎架構、資料處理、統計分析、資料探勘、模型預測、結果呈現。資料收集:在大資料的生命週期中,資料採集處於第一個環節。根據MapReduce產生資料的應用系統分類,大資料的採集主要有4種來源:管理資訊系統、Web資訊系統、物理資訊系統、科學實驗系統。

資料存取:大資料的存去採用不同的技術路線,大致可以分為3類。

第1類主要面對的是大規模的結構化資料。

第2類主要面對的是半結構化和非結構化資料。

第3類面對的是結構化和非結構化混合的大資料,基礎架構:雲端儲存、分散式檔案儲存等。

資料處理:對於採集到的不同的資料集,可能存在不同的結構和模式,如檔案、XML 樹、關係表等,表現為資料的異構性。

對多個異構的資料集,需要做進一步整合處理或整合處理,將來自不同資料集的資料收集、整理、清洗、轉換後,生成到一個新的資料集,為後續查詢和分析處理提供統一的資料檢視。

統計分析:假設檢驗、顯著性檢驗、差異分析、相關分析、T檢驗、方差分析、卡方分析、偏相關分析、距離分析、迴歸分析、簡單迴歸分析、多元迴歸分析、逐步迴歸、迴歸預測與殘差分析、嶺迴歸、logistic迴歸分析、曲線估計、因子分析、聚類分析、主成分分析、因子分析、快速聚類法與聚類法、判別分析、對應分析、多元對應分析(最優尺度分析)、bootstrap技術等等。

資料探勘:目前,還需要改進已有資料探勘和機器學習技術;開發資料網路挖掘、特異群組挖掘、圖挖掘等新型資料探勘技術;突破基於物件的資料連線、相似性連線等大資料融合技術;突破使用者興趣分析、網路行為分析、情感語義分析等面向領域的大資料探勘技術。

模型預測:預測模型、機器學習、建模模擬。

結果呈現:雲端計算、標籤雲、關係圖等。

Tags:技術