事實表明,大數據的挑戰(zhàn)仍然集中在在正確的時間將正確的信息提供給正確的人,即使信息來源和使用在增長。
2013年,行業(yè)專家宣布開始進入大數據時代。他們認為,大數據使組織能夠以正確的速度和正確的時間存儲、管理和操作大量數據,以獲得正確的見解。
大數據并不代表一種單一的技術,而是一組不同的數據管理技術,其根源是之前的幾次技術變革。
現(xiàn)在的問題是:大數據現(xiàn)在在哪里?成熟它的應用需要什么?
公平地說,最近的分析師調查發(fā)現(xiàn),大數據還沒有帶來重大的商業(yè)成果。盡管有這么多的宣傳,但大多數企業(yè)員工仍然無法方便地獲得完成工作所需的信息。隨著信息源、使用和用戶數量的增長,問題仍然集中在在正確的時間將正確的信息提供給正確的人。
數據倉庫vs.數據湖vs.數據結構
為了容納所有這些數據,存儲和管理系統(tǒng)如雨后春筍般涌現(xiàn),比如數據倉庫、數據湖和數據結構。但是,在解決方案和平臺級別上,需要一個數據結構作為跨企業(yè)的所有數據集成、管理和治理的保護傘。企業(yè)間的凝聚力是必須的。
行業(yè)專家指出,集中數據通常是不可行的?;蛘呤褂梅諏Ψ治鲞M行原型化,以訪問不同的數據源,然后如果它被證明是富有成效的,并且業(yè)務需要指示它。中心化在后面完成。
Hurwitz公司分析師DanKirsch指出數據去中心化趨勢和數據結構之間的聯(lián)系。他說,“我們已經看到數據結構方法越來越受歡迎,因為擁有一個中央存儲庫來保存所有的數據是不現(xiàn)實的。”因此,數據結構需要允許異構數據位置。數據結構方法有助于解決分擔責任的挑戰(zhàn),也就是每個團隊負責自己的數據,然后將其連接起來,而不是將數據轉儲到數據湖中。AWS公司認為,數據湖是分析成功的唯一途徑。當然,他們希望企業(yè)將所有數據都轉儲到AWS云平臺上。
Gartner公司數據與分析副總裁NickHeudecker對此表示贊同,并認為所有這些趨勢都很重要。他指出,“每個概念服務于不同的用戶和用例,高性能、可重復分析的數據倉庫。用于問題開發(fā)/實驗的數據湖。數據網格用于使用帶有治理監(jiān)督的分布式數據。因此,沒有混淆?!?br />
將大數據戰(zhàn)略集中在一個平臺上
專家們利用雙重策略,但堅持單一平臺。通常有兩種策略。一種策略是針對產品,另一種是針對分析。每個都有自己的核心樞紐平臺,并支持多個數據存儲庫。然后在兩個核心樞紐之間有一個ETL平臺。
但是,是哪個供應商提供了這些服務的大部分呢?還沒有看到任何一款認為能夠獨立成為完整平臺的游戲。
多個數據存儲庫在很多方面,它不是集中數據,而是集成數據。而如何將所有數據集成起來,使其可視化,并將其連接到其他系統(tǒng)。
集中所有數據會帶來成本、管理和安全問題。數據被鎖定在業(yè)務線應用程序中,在辦公場所和云生態(tài)系統(tǒng)中。連接數據所在位置有助于消除風險,提高洞察速度。這并不是一個單一的供應商解決方案故事。一些企業(yè)提供查詢功能,但治理故事還沒有被任何人充實起來。大數據中使得移動數據成為一個挑戰(zhàn)。多平臺是常態(tài)。如果幸運的話,可以將工具和技能標準化。
因此,數據結構是一種數據管理概念,用于實現(xiàn)靈活的、可重用的和增強的數據集成管道、服務和語義,以支持跨多個部署和編排平臺交付的各種操作和分析用例。
確保遵守數據治理和數據隱私規(guī)則
因此,數據結構是一種數據管理概念,用于實現(xiàn)靈活的、可重用的和增強的數據集成管道、服務和語義,以支持跨多個部署和編排平臺交付的各種操作和分析用例。
確保遵守數據治理和數據隱私規(guī)則
為了有效地管理數據,企業(yè)必須清楚地了解自己擁有哪些數據。組織需要了解他們的數據湖或數據結構中有哪些類型的數據。如果個人身份信息(PII)參與了一個特定的應用程序或新的努力,企業(yè)需要指派一名高管監(jiān)督個人數據的適當使用。高管還可以幫助解決數據的可行性和適用性的問題。
管理人員扮演著至關重要的治理角色。因此,定義“管理員”很重要,他們的全部工作就是在信息的最初來源處訪問和管理對信息的更正。他們從業(yè)務團隊中輪換出來,制定KPI。
重要的是預先定義管理員,并知道如何在過程中與他們簽入。獲得管理員對用戶體驗設計的反饋也很重要。
云計算技術對大數據戰(zhàn)略的影響?
云計算正在成為計算和存儲的另一種形式,而不是一個獨立的環(huán)境。云管理和可見性很重要。假設云計算是一種快速消耗預算的方法。在很多情況下,沒有理由將一些應用程序移到云端。能夠在云上立即對概念和實驗進行證明是非常重要的。
云計算允許組織嘗試新事物,并根據需要增加或刪除計算能力,而不必等待物理工作完成。
數據過程在哪里成熟?
流程需要明確定義術語的基礎。從事務系統(tǒng)開始是至關重要的。如果數據一開始是錯誤的,就需要花費大量時間來清理和增強該數據。
在促進圍繞數據共享場景的領域需要大部分成熟度,比如數據讀寫能力。數據操作可以幫助提高彈性,但它仍然是一種壓倒性的技術實踐。
結語
顯然,大數據正處于分析師所說的“幻滅低谷”。盡管數據驅動型公司將是長期贏家,但仍有工作要做。
獲勝者需要進行數據治理,以使數據足夠用于任務和保護。他們還需要改進數據處理過程。數據操作和數據治理可以一起提供幫助。
違法和不良信息舉報投訴電話:0377-62377728 舉報郵箱:fbypt@www.hnzzxinda.com