第一階段
菜地里的毛菜(原始系統(tǒng)的數(shù)據(jù),有錯誤,不精準(zhǔn),毛菜有泥巴,有黃葉子),相當(dāng)于ERP,PDM系統(tǒng)里面的原始數(shù)據(jù)。
第二階段
從菜地里采集到家,分門別類的堆在一起(初步去掉泥巴,黃葉子,分類堆放),相當(dāng)于從原系統(tǒng)到ODS,ODS的意思是操作數(shù)據(jù),即原始系統(tǒng)中的操作數(shù)據(jù)的一個副本,與原始數(shù)據(jù)是一模一樣的,叫貼源,這個過程就叫數(shù)據(jù)采集、清洗、轉(zhuǎn)換,即ETL干的事情,這個階段叫初加工。
第三階段
把拿回家的各種菜洗凈,去皮,按大小分類,去掉小的、爛的蔬菜,可以賣給超市了,對BI項目來說,就是從ODS到數(shù)據(jù)倉庫的過程,數(shù)據(jù)的精加工過程,去偽存真,也要用到ETL來清洗轉(zhuǎn)換,對缺項的數(shù)據(jù)補充完整,比如合并數(shù)據(jù),合并字段,增加主數(shù)據(jù)描述字段,補充分類等。
第四階段
從菜農(nóng)賣到超市,超市還要經(jīng)過一次加工,比如包裝成一小包一小包的,把蔬菜放在一起,水果放在一起,便于顧客直接購買,這一步就是從數(shù)據(jù)倉庫到數(shù)集市的過程,數(shù)據(jù)集市就是包好、稱好的凈菜,價簽已經(jīng)打好的了,顧客直接付款可以拿走了,從數(shù)據(jù)倉庫到數(shù)據(jù)集市就是形成一個一個的數(shù)據(jù)立方體,這個立方體的數(shù)據(jù)是加工好的,可以單獨發(fā)布出去,離線使用,相當(dāng)于一個execl數(shù)據(jù)文件,你可以用EXECL工具打開,也可以用WPS打開,打開以后,可以用表格表示,也可以用圖表表示。
第五階段
媽媽配菜,媽媽根據(jù)家人一天要吃的菜肴規(guī)劃,挑選各種各樣的菜、肉組合在一起,有的直接可以食用,有的需要再加工,即烹調(diào),然后端出來擺到餐桌上,家人只需要帶一張嘴即可享用,對BI項目來說,就是報表的制作過程,業(yè)務(wù)分析人員,根據(jù)領(lǐng)導(dǎo)的要求,按照各個主題需求,從各個數(shù)據(jù)立方體中、或者一部分從數(shù)據(jù)倉庫中取一些數(shù)據(jù)組合起來,并且定義展現(xiàn)方式,即把報表做好,發(fā)布出來,放到門戶上,給與權(quán)限控制,哪些人可以享用這桌美味,這就是報表制作這個階段干的事情,所以說,業(yè)務(wù)人員是否可以拖拽制作報表,關(guān)鍵看前面的數(shù)據(jù)立方體準(zhǔn)備好沒有,相當(dāng)于是這樣的,不是人人都是烹調(diào)高手,但是超市里面有很多配好的菜(蔥姜蒜都有了),你只要拿回去放放鍋里炒5分鐘或者蒸煮10分鐘,端出來即可,不難吧。至于加工的工具是微軟家的鍋還是IBM家的灶,或者oracle家的飄,有什么關(guān)系呢,這些都是報表制作工具(烹調(diào)工具而已)。
第六階段
享受美味佳肴,把做好的一桌筵席,放到門戶上,當(dāng)然是給有權(quán)限的人享受,這就是管理駕駛艙!
通過上面的分析,懂的為什么會做飯的人就會做大數(shù)據(jù)分析了,簡單吧,所以過年回家和媽媽學(xué)做飯,學(xué)會了就懂得高大上的大數(shù)據(jù)分析。
附:美食制作過程和數(shù)據(jù)分析過程對比圖