維克托·邁爾-舍恩伯格在《大數據時代》壹書中舉了百般例證,都是為了說明壹個道理:在大數據時代已經到來的時候,要用大數據思維去發掘大數據的潛在價值。
什麽是大數據思維?維克托·邁爾-舍恩伯格認為:1)需要全部數據樣本而不是抽樣;2)關註效率而不是精確度;3)關註相關性而不是因果關系。
我們認為,大數據並不在"大",而在於"有用"。大數據思維首先就是要能夠充分理解數據的價值,並且知道如何利用大數據為企業經營決策提供依據,即通過數據處理創造商業價值。
大數據思維核心是理解數據的價值,通過數據處理創造商業價值
《哈佛商業周刊》指出:數據科學家是21世紀最性感的職業。在獲取海量數據後,就要考慮如何去利用數據。數據科學家就是采用科學方法、運用數據挖掘工具尋找新的數據洞察的工程師。大數據時代正是凸顯了數據科學家的重要性以及將數據分析和業務結合的必要性。當具備硬件和基礎設施時以產生海量的數據時,需要有人將大量散亂的數據變成結構化的可供分析的數據,進行整合、清理來形成結果數據集。
人才雷達就是壹個典型例子。基於每個人在網絡上留下的包含著其生活軌跡、社交言行等個人信息的網絡數據,依靠對這些數據的分析,從個人的網上行為中剝離出他的興趣圖譜、性格畫像、能力評估,基於數據挖掘的人才推薦平臺人才雷達(Talent Radar)幫助企業更高效的實現人崗匹配,提供獵頭服務。為了評估壹個技術人員的專業技能,人才雷達利會利用其在專業論壇(如Github、CSDN、知乎、丁香園等)上的發帖數、內容被引用數、引用人的影響力等數據,通過這些信息建模,完成其專業影響力的判斷。同時,微博的數據也被充分利用起來。其中折射出的社交關系也是判斷壹個人職業能力的因素之壹。所以,判別用戶在社交網絡上其好友的專業影響力也是人才雷達推薦系統中的壹個重點。同時,即使被推薦者的個人能力難以符合職業需求,但如果他有著能力不錯的好友關系,則也可以作為合適的"推薦人"將任務傳播到下壹層級當中。不同用戶在社交網絡上的行為習慣也是不同的,例如發微博的時間規律,在專業論壇上的時間長短,這些行為模式可以用來判別其工作時間規律,看其是否符合對應的職位需求。通過各種數據源的融合和分析,人才雷達不僅能夠在節省成本的前提下幫助企業提高人才招聘的效率。與傳統的獵頭業務相比,其采用群體智慧的方式能夠更廣泛和客觀的篩選人才,並且由於其被動測量的方式也能在壹定程度上避免直接面試時部分求職者的虛假表現。它現在的客戶有淘寶、微軟、百度等知名企業。
亞馬遜於2013年12月獲得"預期遞送(anticipatory shipping)"新專利,使該公司甚至能在客戶點擊"購買"之前就開始遞送商品。該技術可以減少交貨時間和減少消費者光顧實體店的次數。在專利文件中,亞馬遜表示訂購和收貨之間的時間延遲"可能會削弱顧客從電商購買物品的熱情。"亞馬遜指出,它會根據早前的訂單和其他因素,預測某壹特定區域的客戶可能購買但還未訂購的商品,並對這些產品進行包裝和寄送。根據該專利,這些預遞送的商品在客戶下單之前,存放在快遞公司的寄送中心或卡車上。在預測"預期遞送"的商品時,亞馬遜可能會考慮顧客過往的訂單、產品搜索、願望清單、購物車的內容、退貨、甚至顧客的鼠標遊標停留在某件商品的時長。這項專利表明,亞馬遜希望能充分利用它所擁有的海量客戶信息,借此形成競爭優勢。
大數據最本質的應用就在於預測,即從海量數據中分析出壹定的特征,進而預測未來可能會發生什麽。當不同的數據流被整合到大型數據庫中後,預測的廣度和精度都會大規模的提高。