歡迎來到培訓(xùn)無憂網(wǎng)!
咨詢熱線 400-001-5729
>
新聞資訊 >
電腦/IT >
數(shù)據(jù)庫工程師 >
長(zhǎng)沙Python處理大數(shù)據(jù)的劣勢(shì)和優(yōu)勢(shì)是什么2022-08-15 11:39:09|已瀏覽:2903次
Python處理大數(shù)據(jù)的劣勢(shì)和優(yōu)勢(shì)是什么?python能處理數(shù)以百萬行級(jí)的大數(shù)據(jù),但是也有它的優(yōu)勢(shì)與劣勢(shì)。而對(duì)于現(xiàn)在的大數(shù)據(jù)量,百萬行級(jí)并不算多,而其起點(diǎn)一般都是在10億以上。python的優(yōu)勢(shì)不在于運(yùn)行效率,而在于開發(fā)效率和高可維護(hù)性。針對(duì)特定的問題挑選合適的工具,本身也是一項(xiàng)技術(shù)能力。下面我們來看看Python處理大數(shù)據(jù)的劣勢(shì)和優(yōu)勢(shì)是什么。
Python處理大數(shù)據(jù)的劣勢(shì):
1、python線程有g(shù)il,通俗說就是多線程的時(shí)候只能在一個(gè)核上跑,浪費(fèi)了多核服務(wù)器。在一種常見的場(chǎng)景下是要命的:并發(fā)單元之間有巨大的數(shù)據(jù)共享或者共用(例如大dict),多進(jìn)程會(huì)導(dǎo)致內(nèi)存吃緊,多線程則解決不了數(shù)據(jù)共享的問題,單獨(dú)的寫一個(gè)進(jìn)程之間負(fù)責(zé)維護(hù)讀寫這個(gè)數(shù)據(jù)不僅效率不高而且麻煩
2、python執(zhí)行效率不高,在處理大數(shù)據(jù)的時(shí)候,效率不高,這是真的,pypy(一個(gè)jit的python解釋器,可以理解成腳本語言加速執(zhí)行的東西)能夠提高很大的速度,但是pypy不支持很多python經(jīng)典的包,例如numpy(順便給pypy做做廣告,土豪可以捐贈(zèng)一下PyPy - Call for donations)
3、絕大部分的大公司,用java處理大數(shù)據(jù)不管是環(huán)境也好,積累也好,都會(huì)好很多
Python處理數(shù)據(jù)的優(yōu)勢(shì)(不是處理大數(shù)據(jù)):
1、異?旖莸拈_發(fā)速度,代碼量巨少
2、豐富的數(shù)據(jù)處理包,不管正則也好,html解析啦,xml解析啦,用起來非常方便
3、內(nèi)部類型使用成本巨低,不需要額外怎么操作(java,c++用個(gè)map都很費(fèi)勁)
4、公司中,很大量的數(shù)據(jù)處理工作是不需要面對(duì)非常大的數(shù)據(jù)的
5、巨大的數(shù)據(jù)不是語言所能解決的,需要處理數(shù)據(jù)的框架雖然小眾,但是python還是有處理大數(shù)據(jù)的框架的,或者一些框架也支持python
6、編碼問題處理起來太方便了
Python處理大數(shù)據(jù)的劣勢(shì)和優(yōu)勢(shì)是什么?通過上面的介紹大家應(yīng)該有所了解了,希望能給熱愛大數(shù)據(jù)開發(fā)的同學(xué)帶來幫助。
注:尊重原創(chuàng)文章,轉(zhuǎn)載請(qǐng)注明出處和鏈接 http://m.universityresearchassociates.com/news-id-49859.html 違者必究!部分文章來源于網(wǎng)絡(luò)由培訓(xùn)無憂網(wǎng)編輯部人員整理發(fā)布,內(nèi)容真實(shí)性請(qǐng)自行核實(shí)或聯(lián)系我們,了解更多相關(guān)資訊請(qǐng)關(guān)注數(shù)據(jù)庫工程師頻道查看更多,了解相關(guān)專業(yè)課程信息您可在線咨詢也可免費(fèi)申請(qǐng)?jiān)囌n。關(guān)注官方微信了解更多:150 3333 6050