中國周刊

用一個平臺處理多模數據,中國星環(huán)科技大數據平臺做到了!

2020-05-19 4:13:21

2003年一場SARS,讓電商風起,普通消費者融入電商。

2020年新冠疫情,讓更多的企業(yè)家走進直播,視野被打開,更多傳統(tǒng)產業(yè)不得不加速數字化。

一個更為廣闊的產業(yè)互聯(lián)網時代已經來臨,數字化轉型已經真正的深入到每一個傳統(tǒng)產業(yè)和傳統(tǒng)企業(yè)當中。

在這個令人激動的數字時代時代,大數據技術正在與云計算、5G、AI等新技術融合,落地速度前所未有的加快。

2020年5月15日,星環(huán)科技全面升級了大數據、云計算、AI為主的三條產品線,并發(fā)布了一代搜索產品Transwarp New Search、知識圖譜全棧解決方案、基于邊緣計算的云邊一體AIoT解決方案、基于人工智能和復雜網絡的實時反欺詐解決方案等,展現(xiàn)了中國大數據基礎軟件與平臺企業(yè)創(chuàng)新成果,讓中國用戶更好的利用日益增加的數據,發(fā)現(xiàn)數據中的價值。

  1.用戶呼喚多模型的數據處理平臺

星環(huán)科技的創(chuàng)始人孫元浩介紹說,2008年開始,大數據平臺就是一組技術或者工具的組合。

在2013年創(chuàng)業(yè)時,星環(huán)科技認為光靠工具的組合不足以解決大數據的問題,必須用產品來解決大數據的4個V——數據量大、數據種類多、數據實時性高、要從數據中發(fā)掘價值。因此,星環(huán)推出Inceptor、Hyperbase、Slipstream、Discover等產品,分別解決大數據的面臨的4V挑戰(zhàn)。

到了2020年,對于一些單一的典型場景,市場上出現(xiàn)不同的產品,有了知名的解決方案,解決數據的多樣性。例如:結構化數據使用Hive;動態(tài)列模型使用Bigtable、Hbase;文檔處理使用MogoDB;圖數據使用Neo4j;搜索引擎ElasticSearch,等等。

但是這些產品都是孤立的,每一個或者類只能解決一類問題,不得不采用不同種類的數據庫,并把它混在一起,需要將數據復制很多份,成本高,效率低。

今天,客戶對這種架構越來越難容忍,希望能用一套大數據平臺,解決各種復雜的數據結構問題。具體而言,客戶希望用一個統(tǒng)一的數據平臺,處理多種數據模型,并能夠提供統(tǒng)一的編程語言、統(tǒng)一的計算引擎,使用統(tǒng)一的存儲管理系統(tǒng)、統(tǒng)一的資源調度系統(tǒng),支持多種不同的數據模型。

目前,大數據行業(yè)一個明顯的發(fā)展趨勢就是推出一個統(tǒng)一的大數據平臺,能夠處理多種數據模型,能夠提供統(tǒng)一的編程語言、統(tǒng)一的計算引擎,使用統(tǒng)一的存儲管理系統(tǒng)、統(tǒng)一的資源調度系統(tǒng),能夠支持多種不同的數據模型。

孫元浩說:“我們把這個統(tǒng)一的大數據平臺,稱為多模型異構的數據處理平臺?!?/p>

  2.一站式大數據平臺解決大數據4V

Transwarp Data Hub(TDH)是星環(huán)科技推出的企業(yè)級大數據平臺,經過7年的快速演進,不斷發(fā)展成熟,在郵政、交通、金融、政府等行業(yè)獲得了大量的部署實施經驗,同時向新生的大數據技術領域進行的拓展和探索。

5月15日,星環(huán)科技全面升級了大數據、云計算、AI為主的三條產品線,發(fā)布了Transwarp Data Hub7.0。

作為星環(huán)科技一站式大數據平臺TDH的最新版本——7.0版本,其一站式多模異構數據處理性能亮眼,打破了行業(yè)內普遍存在的不同數據庫產品切換的不便利,徹底解決大數據發(fā)展的一大瓶頸。

星環(huán)科技研發(fā)總監(jiān)呂程在回答中國軟件網記者提問時認為,作為一個多模型的數據處理平臺,TDH7.0可以提供統(tǒng)一的數據操作/查詢語言SQL、統(tǒng)一的數據計算引擎、統(tǒng)一的分布式存儲管理系統(tǒng)、統(tǒng)一的資源管理框架,滿足利用一個多模異構平臺,處理多種數據的需求。

據介紹,TDH從上而下劃分為五個層次:

最上層是SQL層,開發(fā)了統(tǒng)一的SQL引擎,兼容各種不同的SQL方言;

計算層,開發(fā)了統(tǒng)一的計算引擎,進行統(tǒng)一的計算任務優(yōu)化和分發(fā);

其下的存儲模型層,TDH一個平臺支持七種不同的存儲模型,適用于不同的應用場景,包括:圖存儲Graph Storage、文檔存儲Document Storage、全文檢索Full-text Search、鍵值存儲Key-Value Storage、行列混合存儲Row-Columnar Storage、時空地理存儲Sequential Geospatial Storage、非結構化對象存儲Unstructured Object Storage。

存儲管理層,開發(fā)了統(tǒng)一的存儲管理引擎,提供數據塊分布管理、數據多副本一致性管理、文件服務管理等功能;

最底層資源調度層,開發(fā)了統(tǒng)一的資源調度框架,通過容器化編排,統(tǒng)一調度計算、存儲、網絡資源。

星環(huán)科技通過自主研發(fā),用TDH一站式平臺解決方案,解決了大數據應用的四個V的問題:

大量化(volume),采用分布式計算和分布式存儲框架,充分利用計算機集群的整體計算和存儲能力,解決了數據大量化問題。

速度化(velocity):采用實時流處理引擎,解決了用戶對數據處理時效性的需求。

多樣化(variety):處理的數據類型不再局限于結構化數據,能同時處理文本數據、圖數據等非結構化數據。

價值提升(value):充分利用數據,用于多種數據模型的分析,提升數據價值。

3.統(tǒng)一的數據處理平臺幾大的優(yōu)勢

多模型的數據處理平臺的核心是對外提供統(tǒng)一的SQL編程接口、統(tǒng)一的計算引擎,以及統(tǒng)一的綜合式的存儲管理系統(tǒng)和統(tǒng)一的銷售框架。因此,星環(huán)TDH 7.0的優(yōu)勢優(yōu)勢體現(xiàn)在這幾大特性的統(tǒng)一和融合上。

Transwarp Data Hub 7.0統(tǒng)一的數據處理平臺支持超過7種不同的數據模型,支持結構化的數據和非結構化數據,支持KeyValue介質存儲、全行搜索、排索引、圖存儲、圖數據庫、存儲文檔,也能夠存儲時空數據。這是TDH 7.0的第一大優(yōu)勢。

星環(huán)科技第一家提供了一個能夠橫跨多種數據模型的統(tǒng)一的計算引擎。雖然有不少公司也在嘗試提供一個標準的數據接口,但是由于底層是不同的數據庫,沒用統(tǒng)一的計算引擎,雖然有統(tǒng)一的SQL接口,但是很難把不同的接口靜態(tài)的路由到功能數據庫上面去。因此,需要一個動態(tài)的計算引擎來動態(tài)地進行接口的調度,進行執(zhí)行計劃的統(tǒng)一的管理。

同時在星環(huán)科技的Transwarp Data Hub 7.0中也提出了一個統(tǒng)一的分布式管理系統(tǒng),是實現(xiàn)數據分布管理以及數據一致性的數據管理系統(tǒng),比過往使用HTVS效率更高、一致性更強。

在同一個平臺上可以將一份數據存儲成多種模型,用戶在應用發(fā)生變化時能夠自行地采用最佳的倉儲模型來響應查詢需求,運行效率會更高。同時因為一個平臺處理多種數據模型,整運維成本、管理成本都會降低。

孫元浩說,未來的數據平臺都應該是多模型的,但是用戶使用起來更應該是像使用一個數據庫一樣使用。

從2013年開始,星環(huán)科技逐漸實現(xiàn)了從基于開源改造的產品組件到自主研發(fā)轉變。

到2020年5月的Transwarp Data Hub 7.0問世時,星環(huán)科技已經實現(xiàn)了絕大部分組件自主研發(fā),包括分析型數據庫、流處理引擎、圖數據庫等。今年新推出的搜索引擎中采用了新的復本的一次性算法,對外提供標準的SQL接口。預計到2021年,會完成NoSQL數據庫全系列改造,并融入分布式的存儲管理系統(tǒng)。

孫元浩說,到2021年,星環(huán)科技的全系列產品都將實現(xiàn)自主研發(fā)。


來源:北國網

聲明:

1、中國周刊網所有自采新聞(含圖片),未經允許不得轉載或鏡像,授權轉載應在授權范圍內使用,并注明來源。

2、部分內容轉自其他媒體,轉載目的在于傳遞更多信息,并不代表本網贊同其觀點和對其真實性負責。

3、如因作品內容、版權和其他問題需要同本網聯(lián)系的,請在30日內進行。

編輯:張馨潔

已經到底部