沃森超級計算機賽前趣聞

5438年6月+2009年2月，弗裏德曼和其他制作人第壹次看到了“沃森”，當時超級計算機與兩名人類選手對抗。“沃森”采用IBM POWER7服務器，可以優化其處理的任務。IBM表示，參加挑戰的沃森必須快速處理所有任務。此外，這臺超級計算機還采用了壹系列專利技術，可以同時進行任務和數據處理以及實時信息分析。

法魯西指出，危險的本質是讓技術朝著正確的方向發展。他說:“這個節目涉及的領域很廣，會提出各種各樣的問題，這是我們希望參與的挑戰之壹。這項挑戰是對選手信心的考驗。妳必須在確定答案正確後才能回答。另外，妳得趕緊給出答案。”

IBM表示，“沃森”采用的技術可以在許多領域發揮作用，例如醫療保健，可以幫助提高醫生診斷疾病的準確性，改善在線自助服務臺，為遊客和居民提供相關城市的具體信息，或者通過手機為消費者提供支持。為了做好應對危險的準備，“沃森”已經和這位曾經的危險冠軍戰鬥了50多次。另外還參加了節目組《危險》為所有潛在選手準備的測試，順利通過。

《危險》的制作人哈裏·弗裏德曼(Harry Friedman)表示，IBM最初接觸《危險》時，制作人都很感興趣，但他們也擔心觀眾會不同意沃森參加比賽，並將其視為壹種噱頭或詭計。他說:“現在態度不同了。這是壹場計算機獲得的知識和最優秀的危險選手獲得的知識的較量。這是壹場重要的比賽，我們都想參加。”Watson由90臺IBM服務器和360個計算機芯片驅動程序組成。是壹個10普通冰箱那麽大的電腦系統。它擁有15TB內存，2880個處理器，每秒可以執行80萬億次運算(這是目前的情況)。這些服務器使用Linux操作系統。IBM為Watson配置的處理器是Power 7系列處理器，是RISC(精簡指令集計算機)架構中最強的處理器。采用45nm工藝制造，八核32線程，主頻最高可達4.1GHz，二級緩存達到32MB。它儲存了大量的書籍、新聞和電影劇本資料、詞典、選集以及《世界圖書百科全書》等數百萬種資料。每次看完問題的提示，沃森不到三秒鐘就在自己的數據庫裏挖三尺，在長達2億頁的數據中搜索。

Watson是基於IBMDeepQA(深度開放域問答系統工程)技術開發的。作為沃森超級計算機的基礎，DeepQA技術可以讀取數百萬頁的文本數據，使用深度自然語言處理技術生成候選答案，並根據許多不同的尺度評估那些問題。IBM R&D團隊為沃森開發的超過100組算法，可以在3秒內分析問題，檢索數百萬條信息，然後過濾還原成答案，輸出到人類語言。每種算法都有自己的特殊功能。其中壹種算法叫做嵌套分解算法，可以將線索分解成兩種不同的搜索函數。

沃森超級計算機和谷歌搜索引擎誰更聰明？對於這個問題，前《商業周刊》科技編輯史蒂文·貝克爾(Steven Becker)最近通過分析比較得出結論，沃森超級計算機比谷歌更聰明。貝克爾認為答案很簡單，谷歌還不能回答這個問題。Google對我們人類大腦的依賴表現在兩個方面:壹是在描述用戶的查詢請求時，Google會讓用戶像計算機壹樣思考，選擇三四條最符合計算機意圖的消息，形成查詢結果列表。其次，Google會引導用戶找到與自己查詢的答案相似的答案，讓用戶花更多的腦力找到自己需要查詢的確切答案。沃森超級計算機自己處理所有的問題。它必須解碼復雜的英語，窮盡所有可能的答案，從中選擇壹個，最終決定是否符合要求。對於計算機沃森來說，選擇合適的上下文是壹項艱巨的任務，尤其是在充滿提示和惡作劇的遊戲中，它還必須確定答案的可靠性以及是否需要冒險猜測。沃森需要識別人類的語言，並分析微妙的含義，比如諷刺、謎語、構詞法、詩歌線索等等，通過壹系列數據對比和模擬人類的聯想能力得到準確的答案，然後用人類的語言逆向回答。此外，沃森還可以模仿人類對問題進行戰略性思考，比如問題的選取，是否跳過自己不擅長的話題，甚至可以模仿人類的語氣來搞笑。整個過程只靠計算機和軟件算法完成，沒有工程師的參與(這種快速問答實際上是不能參與的)，也是斷網的，所以計算機不能作弊，必須自己思考。

領導設計沃森的IBM研究團隊的科學家大衛·費魯奇(David Ferrucci)博士表示:經過四年的努力，我們的科學團隊認為，沃森已經能夠快速理解“危險邊緣”問題的內容，分析其所需的信息，獲得準確的答案，並給出可信的答案。沃森會預估節目組《危險邊緣》的剩余獎金數額，他落後或領先其他競爭者多少，他在特定話題上的表現，及時調整自己的信息等級。如果沃森落後對手太多，他的信心水平就會低，比如40%，這個時候他還會繼續努力；但是，當它領先對手的時候，它也會想:我已經領先那麽多了，為什麽還要冒險呢？所以，即使它的置信度值是75%，它也可能選擇不回答。

在開發沃森的四年時間裏，R&D團隊主要以兩種方式評估該系統。首先，他們分批進行大規模測試(比如壹次3000道題)，評估系統性能，實施錯誤分析，提高系統性能。基於這種多問題性能，可以從統計的角度進行重要的性能評估；其次，團隊評價沃森的第二種方式是和《危險邊緣》的前參賽選手對練。在2009年的冬天，他們和曾經出現在《危險邊緣》的玩家打了79場比賽。在過去的秋天，沃森與在《危險邊緣》中贏得冠軍的球員打了55場比賽。這些對練比賽讓R&D團隊對沃森的表現有了深刻的了解。《危險邊緣》是哥倫比亞廣播公司的壹檔智力競賽節目，已經走過了幾十年的歷史。這個節目的比賽以獨特的問答形式進行，設置的問題涉及面很廣，涉及歷史、文學、藝術、流行文化、科技、體育、地理、文字遊戲等等。根據答案形式提供的線索，參與者必須以問題的形式給出簡短而正確的答案。和壹般的問答節目相反，危險邊緣以回答的形式提問，以提問的形式回答。參與者需要具備歷史、文學、政治、科學和流行文化方面的知識，以及能夠分析晦澀難懂的含義、諷刺和謎語的能力，而計算機並不擅長這種復雜的思維。

沃森的初衷是理解更復雜的文字、語言和人類知識。IBM科學家、沃森團隊負責人大衛·費魯奇(David Ferrucci)表示，使用危險邊緣開發計算機系統將推動技術朝著正確的方向發展。他說，這個節目會問各種各樣的問題。這也涉及到自信。當妳認為妳的答案不正確時，不要回答。妳還是需要快速做出判斷。IBM表示，贏得“危險邊緣”競賽不是主要目的。通過沃森的技術，醫生可以更快地診斷案件，律師可以更快地研究案件。《危險邊緣》的執行制片人哈裏·弗裏德曼說:這些非常重要，我們希望成為其中的壹部分。北京時間2011 2月17日，人機大戰最終結果出爐:計算機沃森擊敗人類。IBM和德克薩斯大學聯合開發的超級計算機沃森(Watson)擊敗了美國最受歡迎的智力競賽電視節目歷史上最成功的兩位選手肯·詹寧斯和布拉德·魯特(Brad Root)，成為新的節目之王。

在比賽的第三天，IBM的超級計算機沃森獲得了465，438+0，465，438+03美元的成績，而兩名人類選手肯·詹寧斯和布拉德·魯特分別只獲得了65，438+0.92萬美元和65，438+0.654，38+0.02萬美元。

把三個比賽日的結果加起來，得出最後的總成績。沃森也遠遠領先於人類。在最後的評分中，沃森達到了77147美元，肯·詹寧斯排名第二，但只拿到了24000美元，布拉德·拉特拿到了21600美元，排名第三。

第三個比賽日，沃森壹路領先，以至於在進入最後的Jeopardy之前，人類選手超越沃森的幾率幾乎不存在。

在最後的《危險邊緣》(Jeopardy)中，排名第二的選手肯·詹寧斯(ken jennings)已經放棄追逐沃森，選擇保住第二名的位置，因此他只賭了65，438美元+0，000美元，而排名第三的選手布拉德·拉特(Brad Ratt)則冒險下了他能下的最大賭註——5，600美元。沃森再次暴露了自己的非人性，賭了65438美元+0.7973。哥倫比亞大學醫學中心和馬裏蘭大學醫學院已經與IBM簽約，兩所大學的醫務人員將使用Watson更加快速準確地診斷和治療疾病。在其龐大的信息庫中有許多專業論文發表在期刊上，這使得醫生可以使用最新的科研成果來治療患者。

沃森需要提高才能真正成為醫生的得力助手。醫生需要的不僅僅是答案。而且有時候患者提供的信息不準確或者相互矛盾，需要醫生用豐富的經驗來做出判斷。IBM R&D團隊的下壹個挑戰是讓沃森提供壹些假設的情況。R&D團隊至少需要兩年時間來完成這項任務。？14年前，IBM開發的計算機“深藍”打敗了國際象棋冠軍卡斯帕羅夫。現在，以創始人托馬斯·J·沃森命名的計算機繼續挑戰人類智力的極限。

IBM擅長制造各種復雜的機器。除了服務器，還有智能計算機(小型機集群)。看來IBM不僅僅是壹家生產哲學的公司，就像諷刺的流行語說的那樣。

在1960年代，在人工智能的技術研發停滯數年後，科學家發現，如果通過模擬人腦來定義人工智能，它將進入死胡同。現在，人工智能的最新定義是“通過機器學習、大規模數據庫、復雜的傳感器和巧妙的算法來完成去中心化的任務”，這已經取代了曾經流行的“重建大腦”。

根據這個定義，沃森被認為在人工智能方面又邁進了壹步。“深藍只是在做超大規模計算，它是人類數學能力的體現，”IBM中國研究院高級經理潘嶽告訴《第壹財經周刊》，他也參與了沃森計劃，負責提供數據支持。“在機器學習、大規模並行計算、語義處理等領域，沃森的偉大之處在於將這些技術整合到壹個架構中，以理解人類的自然語言。”

如果這些解釋有點晦澀，可以參考《危險邊緣》的遊戲規則，妳就知道華生的價值了。

《危險邊緣》是哥倫比亞廣播公司的壹檔經久不衰的電視問答節目，從1964開始播出。最奇妙的是，遊戲中的問題包羅萬象，幾乎涵蓋了人類文明的所有領域。它的規則是答對問題可以獲得獎金，答錯就扣錢。

對於人類來說，規則很簡單，但對於沃森來說，這意味著許多挑戰。首先，沃森必須懂宿主的自然語言，這是深藍所不具備的；其次，沃森需要對這些語言進行分析，比如反諷、雙關、連詞，然後根據關鍵詞判斷題目的意思，沃森進行相關搜索，評估各種答案的可能性；最後，選擇三個最有可能的答案。當其中壹個超過50%時，程序啟動，沃森按下應答器。

這些都是通過90臺IBM服務器、360電腦芯片驅動和IBM開發的DeepQA系統來實現的。IBM為沃森提供的處理器是Power 750系列處理器，這是RISC(精簡指令集計算機)架構中最強的處理器——這些處理器可以支持沃森在不到3秒的時間內最終得到可靠的答案。

沃森專註於小型機的並行操作。很難撼動IBM在大型機領域的地位——小沃森(Watson Jr .，創始人老沃森的兒子)執掌IBM時，IBM投入了約60億美元，超過了當年美國國家航空航天局的研發支出，最終擠掉了日本的NEC和法國的Cray，確立了IBM在大型機市場的壟斷地位。

“IBM內部員工培訓中流傳著壹個笑話，就是在大型機領域，97%的市場份額來自IBM，剩下的3%來自被淘汰的IBM二手大型機。”IBM服務器銷售部前方負責人告訴《第壹財經周刊》。

IBM試圖將大型機的優勢帶入小型機領域。沃森專註於90臺小型機的並行計算，這是IBM的新銷售明星。“IBM小型機的運算速度是出眾的，”上述IBM員工評價說，“因為它直接把大型機的CPU研發優勢移植到了小型機上。”

IBM是為數不多的能夠自主研發小型機CPU的廠商，IBM也將這些技術賣給了英特爾以外的芯片廠商。

現在在小型機市場，IBM和HP的市場比例大致是2: 1，而另壹家小型機公司SUN現在主要定位於低端市場。

此外，IBM全球R&D團隊的某個模型也增加了沃森贏得比賽的機會。

這些團隊分工非常細致。比如以色列的海法團隊負責深度開放域問答系統項目的搜索過程，日本的東京負責沃森在問答中的詞義和詞的連接，IBM中國研究院和上海分公司負責給沃森提供不同資源的數據支持，還有專門做算法的團隊和策略投註的遊戲團隊。

“我們就像每壹個不同的虛擬力量，每個人都只做自己最擅長和熟悉的事情。”潘嶽說。

其實這就是IBM的特點，它壹直沿用工業時代的成功模式，比如制造企業更擅長的流水線模式，通過對員工分級的獎懲制度，讓自己的團隊更有效率。

這些由R&D天才開發的DeepQA系統確保了沃森可以擁有全新的人機交互模式，比如理解和分析自然語言。事實上，理解自然語言壹直是IBM研究機構在人工智能方面的強項。

這很像科幻電影裏的橋段——在世界範圍內招募有才能的人，進行秘密的機器人開發計劃。不同的是，IBM的意思顯然更實際。

此前，基於深藍的AIX操作系統已經讓IBM在商業應用和政府部門獲得了大量訂單。IBM還希望將沃森的DeepQA系統應用於醫療服務、咨詢等領域。

“沃森的優勢是給出準確可靠的答案，因此可以為醫生提供更適合患者的解決方案。”潘嶽表示，“醫療領域的應用將是沃森業務最重要的領域。”

如果沃森項目想要在醫療行業實施，還需要面對法律問題。IBM的壹名研究人員表示，“如果沃森的診斷是錯誤的，醫生聽錯了診斷，那麽沃森將面臨被患者告上法庭的危險，這是IBM正在考慮的壹個應用問題。”

對於IBM來說，沃森不僅將在未來繼續挑戰人類智能的極限，還將幫助該公司與亞馬遜、谷歌和微軟爭奪未來科技制高點的主導權。

上一篇:我不是藥神。法律分析

下一篇:西安發布最寬松落戶政策細則是什麽？

華為Sound X發售:1999元音質堪比萬元音箱

戴姆勒專利訴訟