房間0和房間1的設計差别在于房間1允許送出兩個數,可能能使用其中一個數作為幹擾,另一個數逼近準确結果,相當于自己已知自己産生的幹擾規律,獲得額外的資訊在此基礎上進行結果逼近。 - 然而一個數能産生多大的幹擾以及其他人是否同樣地使用各自的幹擾政策參與遊戲使這樣的設計仍然難以得出簡單的分析政策。實際遊戲中的bot大多使用兩個相同的數參與遊戲,大概由于編碼實作一個幹擾政策并不容易。
筆者嘗試用兩個99幹擾房間1,短暫嘗試的幹擾效果如下 [11.834125842632272, 15.70957027658215, 12.027719858079145, 11.107839747544999, 8.428863839947567, 9.096346487187091, 7.778359860458027, 6.474544165217561, 6.723722287338714,
-- 開始參與遊戲 --
15.267547023658606,
11.058229983539984, 10.049750906672033, 12.82479306176399, 9.879252969690132, 10.647926222565173, 15.726754137154414, 20.039176331610648, 16.181363635023164, 16.415281478025253, 17.184901328510932, 12.577513505379953, 13.009407791695809, 17.59948561858875, 16.398978536434615, 15.94530263465642, 17.12179001208229, 14.281413442626263, 18.507154718851403, 19.34474589968453, 19.765347127756534, 16.256888318085398, 18.925442127672767, 18.958282772661768, 17.785406807300053, 17.750818832352596, 17.65321199916438, 21.40009679038467, 18.67503115952983, 13.382672982272219,20.580511675331124, 18.121324975568342, 18.353368106775413]
- 隻能看出在少參與者的情況下有幹擾者參與确實會整體提高結果,但變化趨勢仍然比較複雜
- 本來筆者是打算基于這種變化規律嘗試參與比賽的,無奈發現評判的結果并不是基于兩個送出的數的任意一個而是基于平均值,那房間1的設計初衷是提供使用一個數作為幹擾的可能,那這樣評判的價值是否和設計初衷相違背呢?也難怪幾乎所有Bot都猜兩個一樣的數,那這和房間0有什麼差別呢?