
定量分析“后Hadoop時代”開源趨勢
Hadoop作為開源大數(shù)據(jù)技術的起源,興起于2006年,至今已有16年歷史。報告收集了從Hadoop發(fā)展第10年(即2015年)至今的相關公開數(shù)據(jù),并進行了關聯(lián)分析,定義了開源項目熱力值研究模型,用量化指標描述開源項目的開發(fā)迭代活躍度和受開發(fā)者歡迎程度。 報告所呈現(xiàn)的開源大數(shù)據(jù)熱力圖,從技術全景、技術棧分類以及項目維度對入圍項目的熱力表現(xiàn)進行洞察,將項目進程中的關鍵事件與熱力表現(xiàn)關聯(lián)分析,并訪談了開源基金會、知名開源項目等領域專家,嘗試找到項目健康發(fā)展一般規(guī)律,并對有效提升項目影響力的方法論進行了歸納總結。開源大數(shù)據(jù)技術的“摩爾定律”
報告發(fā)現(xiàn),每隔40個月,熱力值會提升1倍,開源大數(shù)據(jù)完成一輪技術迭代升級,而且技術周期在加速縮短。在8年時間內,發(fā)生了多輪熱力變遷,反映出背后技術的更新?lián)Q代趨勢。開發(fā)者對「數(shù)據(jù)查詢與分析」保持了長期的開發(fā)熱情,連續(xù)8年位居熱力值榜首。2017年,「流處理」熱力值超過「批處理」,大數(shù)據(jù)處理進入實時階段。數(shù)據(jù)規(guī)模不斷擴大,數(shù)據(jù)結構也更多樣化,「數(shù)據(jù)集成」從2020年開始爆發(fā)式增長。三大熱力趨勢:多元化、一體化和云原生
用戶需求多樣化推動技術多元化?!笖?shù)據(jù)湖」以34%的熱力值年均復合增長率高居熱力值增速第一位,「交互式分析」、「DataOps」緊隨其后,分列第二、三位 。而原有Hadoop體系的產品迭代則趨于穩(wěn)定,熱力值年均復合增長率為1%。 從2015年開始,計算部分率先進入「一體化」演進歷程,其中的典型代表「流批一體」在2019年出現(xiàn)了第一個熱力峰值。以數(shù)據(jù)湖存儲為代表的存儲一體化從2019年起進入了一個新的發(fā)展階段,涌現(xiàn)了Delta Lake、 Iceberg和Hudi等熱點項目。 云原生大規(guī)模重構開源技術棧。誕生于云原生時代的開源項目如雨后春筍般破土成長?!笖?shù)據(jù)集成」、「數(shù)據(jù)存儲」、「數(shù)據(jù)開發(fā)與管理」等領域均有重大項目更迭,新項目熱力值占比已經超過了80%。開源大數(shù)據(jù)熱力榜單TOP30
本報告從102個入圍項目中,評選出了TOP30熱力榜單。Kibana以989.40的熱力值高居榜首。ClickHouse(數(shù)據(jù)查詢與分析)、Airflow(數(shù)據(jù)調度與編排)、Flink(流處理)、Airbyte(數(shù)據(jù)集成)分別摘得各自細分領域的TOP1。Pulsar、Doris、StarRocks、DolphinScheduler、SeaTunnel等一眾中國開源項目也表現(xiàn)出高熱力趨勢。把解決用戶痛點作為核心競爭力,是這些優(yōu)秀開源項目的共同特征,這一特征保證它們與時俱進,成為熱力趨勢中的“常青樹”。
報告下載地址:
https://www.openatom.org/other/%E5%BC%80%E6%BA%90%E5%A4%A7%E6%95%B0%E6%8D%AE%E7%83%AD%E5%8A%9B%E6%8A%A5%E5%91%8A2022.pdf
原文標題:《2022開源大數(shù)據(jù)熱力報告》重磅發(fā)布
文章出處:【微信公眾號:開放原子】歡迎添加關注!文章轉載請注明出處。
-
OpenHarmony
+關注
關注
29文章
3847瀏覽量
18493 -
開放原子基金會
+關注
關注
1文章
494瀏覽量
5787
原文標題:《2022開源大數(shù)據(jù)熱力報告》重磅發(fā)布
文章出處:【微信號:開放原子,微信公眾號:開放原子】歡迎添加關注!文章轉載請注明出處。
發(fā)布評論請先 登錄
億緯鋰能八款開源電池王牌產品重磅發(fā)布
斯坦福大學發(fā)布《2025 年人工智能指數(shù)報告》

零知開源平臺重磅升級!嵌入式開發(fā)進入“渦輪增壓”時代
大模型訓練:開源數(shù)據(jù)與算法的機遇與挑戰(zhàn)分析

汽輪機熱力循環(huán)分析
小米開源2024年度報告發(fā)布
2023年度《中國公路貨運運行大數(shù)據(jù)分析報告》發(fā)布

東軟與中國信通院聯(lián)合發(fā)布數(shù)據(jù)報告
開源鴻蒙操作系統(tǒng)5.0 Release版本發(fā)布
黃鶴開源社區(qū)正式發(fā)布
開源鴻蒙應用案例重磅發(fā)布
Meta重磅發(fā)布Llama 3.3 70B:開源AI模型的新里程碑

評論