1,阿裏巴巴
阿裏巴巴有交易數據,有信用數據,更多的是搭建數據流通、采集、共享的底層架構。
2.華為華為雲服務
它集成了高性能計算和存儲能力,為大數據的挖掘和分析提供了專業、穩定的IT基礎設施平臺。最近華為大數據存儲實現了40PB文件系統的統壹管理。
3.百度(全球最大的中文搜索引擎)
百度的優勢體現在海量數據、十幾年積累的用戶行為數據、自然語言處理能力以及深度學習領域的前沿研究。近日,百度正式發布大數據引擎,將率先在政府、醫療、金融、零售、教育等傳統領域開展對外合作。
大數據,或稱巨量數據,是指涉及的數據量巨大到無法通過目前主流的軟件工具捕捉、管理、處理和整理,以幫助企業在合理的時間內做出更加積極決策的信息。
在維克多·邁耶-勛伯格和肯尼斯·庫克耶合著的《大數據時代》中,大數據是指所有的數據都用於分析和處理,而沒有隨機分析(抽樣調查)的捷徑。大數據的5V特征(IBM提出):體量(海量)、速度(高速)、多樣性(多樣性)、價值(低價值密度)、真實性。
“大數據”的研究機構Gartner給出了這樣的定義。“大數據”是壹種信息資產,需要新的處理模式來擁有更強的決策、洞察和流程優化能力,以適應海量、高增長率和多樣化。
麥肯錫全球研究院給出的定義是:規模遠遠超出傳統數據庫軟件工具在獲取、存儲、管理和分析方面能力的數據集,具有數據規模海量、數據流動迅速、數據類型多樣、價值密度低四大特征。