2022-08-14 15:23:56|已瀏覽:120次
大數(shù)據(jù)技術(shù)的具體內(nèi)容有哪些?大數(shù)據(jù)技術(shù)的具體內(nèi)容:
分布式存儲計算架構(gòu)(強烈推薦:Hadoop)
分布式程序設(shè)計(包含:Apache Pig或者Hive)
分布式文件系統(tǒng)(比如:Google GFS)
多種存儲模型,主要包含文檔,圖,鍵值,時間序列這幾種存儲模型(比如:BigTable,Apollo, DynamoDB等)
數(shù)據(jù)收集架構(gòu)(比如:Kinesis,Kafla)
集成開發(fā)環(huán)境(比如:R-Studio)
程序開發(fā)輔助工具(比如:大量的第三方開發(fā)輔助工具)
調(diào)度協(xié)調(diào)架構(gòu)工具(比如:Apache Aurora)
機器學(xué)習(xí)(常用的有Apache Mahout 或 H2O)
托管管理(比如:Apache Hadoop Benchmarking)
安全管理(常用的有Gateway)
大數(shù)據(jù)系統(tǒng)部署(可以看下Apache Ambari)
搜索引擎架構(gòu)( 學(xué)習(xí)或者企業(yè)都建議使用Lucene搜索引擎)
多種數(shù)據(jù)庫的演變(MySQL/Memcached)
商業(yè)智能(大力推薦:Jaspersoft )
數(shù)據(jù)可視化(這個工具就很多了,可以根據(jù)實際需要來選擇)
大數(shù)據(jù)處理算法(10大經(jīng)典算法)
Hadoop集群與管理
這里會涉及到一些比較高級的數(shù)據(jù)庫管理知識,乍看之下都是操作性的內(nèi)容,但是做成容易,做好非常難。
1、Hadoop集群的搭建 2、Hadoop集群的監(jiān)控 3、Hadoop集群的管理 4、集群下運行MapReduce程序
ZooKeeper基礎(chǔ)知識
ZooKeeper的目標就是封裝好復(fù)雜易出錯的關(guān)鍵服務(wù),將簡單易用的接口和性能高效、功能穩(wěn)定的系統(tǒng)提供給用戶。
HBase基礎(chǔ)知識
HBase – Hadoop Database,是一個高可靠性、高性能、面向列、可伸縮的分布式存儲系統(tǒng),利用HBase技術(shù)可在廉價PC Server上搭建起大規(guī)模結(jié)構(gòu)化存儲集群。
與FUJITSU Cliq等商用大數(shù)據(jù)產(chǎn)品不同,HBase是Google Bigtable的開源實現(xiàn),類似Google Bigtable利用GFS作為其文件存儲系統(tǒng),HBase利用Hadoop HDFS作為其文件存儲系統(tǒng);Google運行MapReduce來處理Bigtable中的海量數(shù)據(jù),HBase同樣利用Hadoop MapReduce來處理HBase中的海量數(shù)據(jù);Google Bigtable利用 Chubby作為協(xié)同服務(wù),HBase利用Zookeeper作為對應(yīng)。
1、HBase定義 2、HBase與RDBMS的對比 3、數(shù)據(jù)模型 4、系統(tǒng)架構(gòu) 5、HBase上的MapReduce 6、表的設(shè)計
注:尊重原創(chuàng)文章,轉(zhuǎn)載請注明出處和鏈接 http://m.universityresearchassociates.com/news-id-49661.html 違者必究!部分文章來源于網(wǎng)絡(luò)由培訓(xùn)無憂網(wǎng)編輯部人員整理發(fā)布,內(nèi)容真實性請自行核實或聯(lián)系我們,了解更多相關(guān)資訊請關(guān)注數(shù)據(jù)庫工程師頻道查看更多,了解相關(guān)專業(yè)課程信息您可在線咨詢也可免費申請試課。關(guān)注官方微信了解更多:150 3333 6050