天天看點

極限帆船賽中的資料分析

極限帆船賽中的資料分析

各大公司的資料分析業務紛紛進入體育領域

“取得好成績的不是使用最多資料的,而是使用得最聰明的”

你一定很好奇一艘雙體帆船如何能在風速隻有不到20節的海面上以70公裡每小時的速度行進。船員的技術和經驗當然是重要因素。但當丹麥sap船隊出現在5月1日的青島國際極限帆船賽場上時,是賽前收集的數以tb計的資料資料幫助它在第四輪甩開第二名幾十米率先沖線。

“每場比賽都會産生海量的資料,風力、風速和距離資料都對我們在比賽中的表現至關重要。”sap極限帆船隊聯合船長jes gram-hansen說。

每艘競賽帆船上都安裝有兩個gps跟蹤傳感器,這些傳感器會把帆船的位置資訊、速度和風向距離傳送到賽事技術服務商的雲伺服器上。除此之外,跟蹤比賽帆船的裁判船上還配備了用來收集風力風向資料的傳感器,這些資料也同時被收集起來。

極限帆船賽的規則很簡單——發令槍響,十二隻參賽帆船一齊向終點浮标進發,最先到達的船隻即為獲勝。由于船速甚至可以超過風速,故名“極限”。然而,要想在風雲變幻水流不定的海面上名列前茅,船長和舵手必須重點考慮三個要素——與風向的最佳夾角、最佳風向距離和最佳路線。

極限帆船系列賽的官方技術合作夥伴sap公司的商業資訊顧問milan cerny表示:“風向距離與絕對距離不同,它是帆船行駛方向與風向夾角所對的直角邊。這些資料難以目測和标準化,大資料分析技術卻可以實時精确地進行記錄分析。”

由于風力和水流因素的影響,直線路線未必最短,也未必最快。計算出帆船在離風力線多遠的距離做哪個動作可以讓它最快地到達終點就變得十分重要。而這正是大資料分析技術所擅長的。

“由于比賽過程中禁止使用任何電子裝置,是以我們會在賽前根據預測做出準确的戰術和戰略決策,”jes gram-hansen表示,“比賽結束後,大資料會幫助我們分析本場比賽中有哪些問題、哪些需要提高以及哪裡做得比較好。”

國際極限帆船比賽一直是各大公司比拼技術的競技場。每年于美國舊金山海灣舉辦的美洲杯帆船賽便有甲骨文公司的身影。參加該項比賽的每艘船上都裝有三百多個傳感器,每秒鐘收集10次3000個變量的資料,從船的速度到風力,再到主帆尾帆的角度。而由甲骨文公司提供技術支援的美國隊已經連續兩年問鼎該項賽事冠軍。

甲骨文首席營銷官judy sim表示:“美國隊利用收集到的資料來确定比賽過程中的某個特定階段更适合用備用的哪艘帆船,而這些分析結果在比賽開始前一小時就能計算完成。”和國際極限帆船賽一樣,美洲杯禁止在比賽過程中使用資料分析工具。比賽開始前,這些裝置要被打包進一個黑色的漂浮箱,放置在船體兩側,賽後對資料進行回收。

事實上,sap、甲骨文和ibm等公司的野心遠不止于極限帆船這一個項目,它們早已經把觸角伸向了網球、f1賽車和nba等多項國際主流體育賽事的賽場上。

ibm公司從2005年便開始通過slamtracker追蹤網球四大滿貫賽事8年來全部8128場、每場4100萬個資料點。由這些資料生成的報告keys to the match不僅為對陣雙方選手呈現出三項獲勝的關鍵名額,還給出了具體的量化标準。

在今年澳網李娜與齊布爾科娃的對戰中,keys to the match為李娜提供的三項關鍵名額分别是一發得分率、發球局3拍及以下得分率和ace球比例。它告訴李娜要想戰勝齊布爾科娃,一發得分率必須要達到40%以上;而反過來,齊布爾科娃則要超過60%。

盡管大資料分析技術強大有效,但它的應用卻不是一勞永逸的。資料可以幫助運動員理清決定性因素,卻不能代替運動員做出決定。jes gram-hansen還是要自己轉舵,李娜還是要自己決定要不要來到網前。

“最終使用哪些資料還是要基于人類的判斷,那些能夠取得好成績的不是使用最多資料的,而是使用得最聰明的。”milan cerny表示。

正如nate silver在《資訊與噪聲》中所說,我們收集的資料越多,從噪聲中分辨出信号的難度就越大。過度使用資料反而會不利于有好的表現。“由于舊金山灣地區複雜且瞬息萬變的天氣狀況,資料反而可能産生誤導作用。”judy sim說。

原文釋出時間為:2014-06-01

本文來自雲栖社群合作夥伴“大資料文摘”,了解相關資訊可以關注“bigdatadigest”微信公衆号

繼續閱讀