尋覓數據科學家
另一類與CDO一樣受到廣泛關注的大數據專業(yè)人才是數據科學家。
“什么是數據科學家?”Bitly公司的首席數據科學家Hilary Mason負責從Bitly收集的數據中尋找價值并建立系統,“我的團隊負責建立數學模型,編寫代碼并開發(fā)基于信息的產品系統。”
數據科學是一門交叉學科,涉及統計學、計算機科學以及特定領域的專業(yè)知識等。Hilary Mason將數據科學劃分為兩部分:一部分是分析,另一部分是從數據中提取具有洞察力的新技術,這在以前是不可能做到的。數據科學是分析能力和新算法的結合體。
“數據科學家的工作就是要提出正確的問題。”Hilary Mason解釋說,“如果我問這樣一個問題,這個鏈接的點擊數是多少?這就不是一個關于數據科學的問題。如果我問這樣一個問題,根據這家出版商網站之前的歷史鏈接,我們能否預測未來三小時內將有多少來自法國的用戶讀到這個內容?這就是一個有關數據科學的問題。”
陳靚分析說:“CDO的職責是為企業(yè)的業(yè)務和數據提供更好的價值平臺。通過CDO的工作,企業(yè)能將數據轉化為業(yè)務語言,被管理層更好地理解和運用。因此,企業(yè)對CDO的數據業(yè)務專業(yè)性要求并不高。而數據科學家是專業(yè)數據的研究者,其主要工作是對數據及其價值的專業(yè)性進行研究,比如數據科學家隊伍中包括數據分析師、數據挖掘師、數據可視化設計師等。”
做業(yè)務與技術之間的橋梁
“大數據項目的落地一定要有企業(yè)高層的認可和支持。大數據項目將會影響企業(yè)未來業(yè)務的發(fā)展、經營決策甚至是投資方向。”
——SAP中國區(qū)副總裁、數據庫及技術平臺事業(yè)部總經理 鄒作基
“兩年多前,我們與美國的一些金融行業(yè)的大客戶接觸時,它們已經擁有了CDO這樣的崗位。”SAP中國區(qū)副總裁、數據庫及技術平臺事業(yè)部總經理鄒作基告訴記者,“2008年,國際金融危機席卷全球。在那之后,金融行業(yè)的用戶都加強了對業(yè)務風險的監(jiān)管。有效控制金融業(yè)務風險的一個重要前提就是實現對數據的管控。金融用戶中設立CDO崗位的比較普遍,但是像制造、零售等對大數據同樣有迫切需求的企業(yè)則很少擁有CDO。”
技術與業(yè)務的有機結合
談到中國的企業(yè)是否應該設立CDO這一職位時,鄒作基表示:“CDO這個名稱其實并不重要,關鍵是企業(yè)中要有人能夠十分清楚業(yè)務流程,并且能合理安排與數據分析相關的各項工作。”其實,所有企業(yè)都面臨著激烈的競爭和如何把控業(yè)務風險的問題。CDO的主要職責是將企業(yè)內的所有數據有效調動和運作起來,將有用的信息放到真正需要它的地方。某些企業(yè)的CIO可能兼具CDO的職能,或者企業(yè)會成立一個專門的團隊來負責數據的管理。不可否認,大數據已經與企業(yè)的業(yè)務密不可分,它很可能在企業(yè)未來的競爭中起到十分關鍵的作用。
大數據涉及的不僅僅是技術方面的問題。CDO應該主要從業(yè)務層面去審視大數據的應用。數據存放在哪里,數據應該如何處理,哪些人能擁有數據,為什么要這樣使用數據……CDO必須能夠明確地解答這些問題。“CDO應該站在業(yè)務團隊和技術團隊的中間,就像是一座橋梁,可以把業(yè)務需求與IT規(guī)劃聯系起來。”鄒作基表示,“CDO其實是一種功能。CDO能發(fā)揮什么樣的作用,還要看每個企業(yè)在大數據方面的需求以及策略。”
舉例來說,一個零售企業(yè)以前可能只能通過CRM系統來了解和掌握客戶的需求,F在,隨著社交媒體的興起,零售企業(yè)有必要也有可能從微博、博客、論壇等社交媒體上了解與企業(yè)和經營相關的信息。以前,企業(yè)的IT架構不具備處理海量社交媒體數據的能力,但是現在,實時、快速地處理大量的非結構化數據已經成了一種常態(tài)。對于CDO來說,他的職責就是利用IT手段找到企業(yè)所需的數據和信息,并發(fā)揮其應有的價值。
從顧問咨詢的角度出發(fā)
“十多年前,銀行就設有業(yè)務分析師。這些人主要是從業(yè)務部門的角度出發(fā)去分析數據。”鄒作基介紹說,“今天的CDO與這些業(yè)務分析師很相像。不同的是,CDO要面對大數據的種種挑戰(zhàn),而且數據分析與管理不再是某一個部門的需求,而是整個公司戰(zhàn)略層面的問題。大數據分析一定是企業(yè)級的、大范圍的、跨部門的事情。”
在業(yè)務流程、數據處理和應用方面,SAP已經有了40多年的專業(yè)經驗。“在面對客戶時,SAP不是單純地講述產品的功能,而是了解客戶的業(yè)務流程,能夠從解決用戶的實際問題出發(fā),為用戶提供更多的價值。”鄒作基告訴記者,“我們擁有一批專業(yè)的價值工程顧問,稱為Value Engineer 。這些Value Engineer都具有豐富的行業(yè)經驗。在確定解決方案之前,他們會與客戶進行深入探討,分析客戶面臨的困難,向客戶建議應該采用什么樣的解決方案,以及能夠獲得什么樣的預期回報等。”
大數據的分析與管理追求的一個目標是更快的處理速度。鄒作基說:“SAP HANA內存計算平臺是SAP實時數據平臺的核心組件,其設計出發(fā)點是不斷提高大數據的實時處理能力。”SAP HANA是一個軟硬件的結合體,具有高性能的數據查詢功能,用戶可直接對大量實時業(yè)務數據進行查詢和分析,而不需要對業(yè)務數據進行建模、聚合等。
大數據對所有企業(yè)來說都是一個新的機遇。企業(yè)只有擁有了像CDO、數據科學家、數據分析師這樣的專業(yè)人才,才有可能將技術與業(yè)務有機地結合在一起,從而確保大數據項目的成功開展。
數據科學家一將難求
“企業(yè)的大數據業(yè)務,并非一個人就能完全掌控和完成的,而是需要一個團隊。當然,企業(yè)需要一個強有力的領導者,才能把團隊中每個人的才能發(fā)揮到極致。”
——Informatica高級副總裁兼首席信息官 托尼·楊
有大數據應用的企業(yè)都要設立一個CDO崗位嗎?“我并不認為這兩者之間有必然的聯系。一些大型的互聯網公司都有大數據系統,但并不一定有CDO這個職位。CDO只是一個工作職位而已。”Informatica高級副總裁兼首席信息官托尼·楊表示。
參透數據的本質
托尼·楊表示:“許多大型的公司有市場、銷售、財務、人力資源、服務、供應鏈和生產管理等多個職能部門。所有職能部門都是共同協作的,而不是獨立存在的,這有點像人體中的各種器官。數據會在各個職能部門的不同系統間流動。CDO的職責是在這些職能部門的數據中發(fā)掘價值,并制定戰(zhàn)略決策。并不是有大數據應用的企業(yè)都要設立一個CDO職位。一般情況下,CDO會向CTO或CEO匯報工作。”
Informatica雖然專注于數據集成業(yè)務,與大數據打交道最多,但是Informatica公司并沒有專職的CDO。托尼·楊介紹說:“過去,我們有一個人專門負責數據管理,其職能與CDO類似。這是一項要求非常高的工作。負責數據管理的這個人必須具備多種能力,并且要全面了解公司的業(yè)務運作流程,此外還要跟蹤流動的客戶數據,掌控一個產品的全生命周期。”