Hadoop掀起大數據革命 三巨頭齊發力
分享 2011.11.15 瀏覽次數:10873次
導讀:開源的數據處理平臺憑借其低成本、高擴展性和靈活性的優勢已經贏得了多數網絡巨頭的認可。現在Hadoop將進入更多企業。 IBM將在明年推出內置NoSQL技術的DB2旗艦級數據庫管理系統。上個月Oracle和Microsoft也分別透露了將計劃在明年發布基于 Hadoop的產品。兩家公司都計劃提供協助部署服務和企業級支持。Oracle已經承諾將會在大數據設備中預裝Hadoop軟件。
大數據革命正以Apache Hadoop為呼叫中心如火如荼的進行著。自從開源分布式數據處理平臺在5年前發布時討論之聲就不絕于耳。但在過去的18個月中,Hadoop贏得了客戶的認可,并得到眾多商業化的支持以及眾多數據庫和數據集成軟件商的整合。在眾多廠商之中最著名的三個商業數據供應商當屬Oracle、IBM和 Microsoft。
Hadoop會在未來成為大數據的重大技術嗎?
Hadoop是一個基于Java的分布式密集數據處理和數據分析的軟件框架。Hadoop在很大程度上是受Google在2004年白皮書中闡述的 MapReduce的技術啟發。MapReduce工作原理是將任務分解為成百上千塊的小任務,然后發送到計算機集群中。每臺計算機再傳送會自己那部分信息,MapReduce則迅速整合這些反饋并形成答案。
Hadoop的擴展性非常優秀,Hadoop可處理分布在數以千計的低成本X86服務器計算節點中的大型數據。同時由于眾所周知的摩爾定律,內存和磁盤的容量也在不斷增長。Hadoop對硬件的支持也在加強,現在每個節點可部署16核的處理器,12TB甚至24TB磁盤。Cloudera透露其推出的產品每個節點的成本大約4000美元。這個價格對于關系數據庫部署每TB 10000至12000美元來說極具競爭優勢。
這種高容量低成本的組合引人注目,但Hadoop最吸引人的是其處理混合數據類型的能力。
Hadoop可以管理結構化數據,以及諸如服務器日志文件和Web點擊流的數據。同時還可以管理以非結構化文本為中心的數據,如Facebook和 Twitter。這種處理多類型數據的能力非常重要。它催生了NoSQL平臺和產品。如Cassandra, CouchDB, MongoDB以及Oracle最新的NoSQL數據庫。而傳統關系型數據庫如Oracle,IBM DB2,Microsoft SQL Server和MySQL則都不能處理混合數據類型和非結構化數據。 由于事務處理靈活性的需求,Hadoop獲得大多數數據分析廠商的關注和支持。
Hadoop已被廣泛應用
現今,Hadoop已被認為是非結構化數據的專用技術。低成本、高擴展性和靈活性等優勢已成為處理大規模點擊流量分析和廣告定位等網絡巨頭(如AOL和comScore)的首選。
AOL三年多時間一直使用Hadoop。AOL的研發團隊在加利福尼亞州的Mountain View部署了300節點的系統,該系統可以存儲每天數十億事件和超過500TB的點擊流數據。點擊所帶來流數據是高度結構化的,但數據量是非常龐大和多樣的。所以幾乎不可能處理所有的提取、轉換和負載工作。AOL為了解決以上問題決定使用Hadoop MapReduce處理分布在數百個計算節點的數據過濾和關聯任務。由于Hadoop為業務帶來的優勢,AOL的Hadoop研發團隊在今年四月在其總部部署了700節點的系統。
Hadoop適用于所有類型數據的特性注定將使Hadoop在更廣泛的領域使用。例如提供托管服務和中小型企業應用服務提供商SunGrad。他們將計劃推出基于云的托管服務,旨在幫助金融服務公司處理他們基于Hadoop MapReduce的數據處理。
商用軟件廠商Tidemark最近也推出一款SaaS軟件,這種基于云的性能管理應用使用MapReduce將混合數據源轉化為產品或金融規劃方案。
三巨頭大數據領域齊發力
在上月美國拉斯維加斯舉行IOD年度大會上IBM院士、DB2總架構師Curt Cotner宣布IBM將在明年推出內置NoSQL技術的DB2旗艦級數據庫管理系統。他還表示未來的數據庫發展方向是非關系數據庫NoSQL。目前 Google的BigTable和Amazon的Dynamo都用NoSQL型數據庫,而傳統的關系數據庫在應付超大規模、高并發的SNS、web2.0 網站已經力不從心。同時IBM發布了一系列數據分析軟件,包括云計算版本的InfoSphere BigInsights。BigInsights是一套建立在Hadoop上的數據分析軟件,能夠處理企業用戶收集大量非結構化資料。
微軟也在10月12日在西雅圖舉行的SQL PASS 2011峰會宣布將與從雅虎分拆出來的Hortonworks合作開發Hadoop,并將在Apache Hadoop上實現搭建Windows Azure以及Windows Server平臺。同時基于Hadoop的Windows Server還會與微軟現有的BI工具聯合處理任務。
Oracle作為全球最大的關系型數據庫提供商也有所行動。其在2011 Oracle全球大會上推出了Big Data Appliance。Big Data Appliance是一個集成了Hadoop、NoSQL Database、Oracle數據庫Hadoop適配器、Oracle數據庫Hadoop裝載器及R語言的系統。
Hadoop的未來
根據目前的狀況來看,Hadoop作為企業級數據倉庫體系結構核心技術,在未來的數年中將會保持持續增長的勢頭。包括MapR、Zettaset、 Cloudera、HStreaming、Hadapt、DataStax、Datameer這些與Hadoop相關的新公司已經獲得投資,為人們所熟知,為各種市場帶來最新技術。
與此同時下一代的MapReduce會完善很多之前不盡人如意的地方。首先節點數將從目前的4000增加到6000-10000,其次并發的任務數從目前的40000增加到100000。另外將繼續加大對硬件支持,同時架構也會有所改變,包括更多編程模式的支持。
歡迎轉載,本文版權歸于杭州網站建設(http://www.hhxlawyer.com)
更多IT行業資訊:怎么樣提升(IT)產品用戶體驗?
- PREV:怎么樣提升(IT)產品用戶體驗?
- NEXT:以小見大、由淺入深-談如何面試Javascript工程師
-
杭州網站建設:醫院網站設計中的“學習與執行”
日期:2025-06-10瀏覽次數:2003次
-
杭州網站制作公司:大型企業網站建設的核心要素與實踐
日期:2025-06-10瀏覽次數:1951次
-
杭州網站設計:醫院網站建設的主要內容與前景展望
日期:2025-06-10瀏覽次數:1981次
-
杭州網站建設:傳統企業網站面臨的挑戰與變革
日期:2025-05-16瀏覽次數:4753次
-
杭州品牌網站開發:建設與后期維護的雙重策略
日期:2025-05-16瀏覽次數:4768次
相關新聞
整合同類新聞,相關新聞一手掌握
-
金融類app開發設計考慮
日期:2021-03-18瀏覽次數:5728次
-
金融APP開發功能
日期:2021-03-05瀏覽次數:5449次
-
金融APP開發能夠帶來什么
日期:2021-03-02瀏覽次數:5815次
最新新聞
與互聯網同行,實時掌握網建行業最新動態
-
安徽全省網絡癱瘓3小時 可能遭黑客攻擊
日期:2010-09-13瀏覽次數:11887次
-
網站建設之網站首頁設計風格建議
日期:2019-07-11瀏覽次數:8725次
-
火神山診斷技術馳援海外,多國上線中國新冠肺炎AI技術
日期:2020-04-01瀏覽次數:9308次
-
杭州小程序開發之旅游小程序的價值
日期:2021-01-16瀏覽次數:8264次
-
美容網站優化哪家好-杭州帷拓
日期:2023-02-06瀏覽次數:6491次
隨機新聞
新聞新動態,您需要的新聞管家
洞悉市場趨勢演變讓傳播回歸社會
免費獲取網站建設與網絡推廣方案報價
-
關于我們
杭州帷拓科技有限公司,是一家新型的全案網絡開發公司,作為以互聯網高端網站建設、APP開發、小程序開發為核心的專業網絡技術服務供應商,帷拓科技致力于全面分析市場環境、衡量與預測市場需求、整合區別于行業競爭對手的絕對優勢,結合品牌理念深度挖掘項目優勢和產品價值,提升客戶品牌認知、認可度。
-
我們的客戶
帷拓科技歷經十年沉淀,與國內外上千家客戶達成合作關系,其中穩定合作的公司有:浙江華為、浙江移動、浙江5G產業聯盟、浙江省社科院、綠城足球俱樂部、娃哈哈雙語學校、健康中國杭州峰會、科雷機電等,帷拓科技始終堅持“帷有專業,才能拓展無限”的服務理念,堅持“認真堅持細節”的優質服務理念,不斷完善自身,成就企業,最終實現共贏。
-
我們的業務
帷拓科技主營業務范圍包含互聯網高端網站建設、APP開發、小程序開發、商城網站建設、公眾號運營以及數字營銷等,涵蓋了服務、房產、數碼、服裝、物流貿易等行業,根據品牌現狀,為每個客戶量身定制項目整體服務方案,以敏銳的市場洞察力、創新的市場策劃能力,全面把握市場變化,為客戶實現從企業到消費者的價值轉換。