摘要
在CDN系統中,IP位址庫在流量排程、網絡服務品質監測等方面起到重要的作用,本文主要介紹了IP位址庫的功能、内容以及IP位址庫的生成和評價方法
什麼是IP位址庫?
所謂IP位址庫,指的是提供了IP位址(段)同地理、ISP、結構等資訊映射關系的一組資料
IP位址庫有什麼用?
IP位址庫應用的場合較為廣泛,下面舉幾個常見的例子:
(1)根據客戶的IP位址确定客戶來源,為後期的客戶行為分析提供基礎,例如需要統計學生群體的通路特點,這時我們就是通過分析來自教育網的IP位址的那些請求得到的
(2)為不同區域的使用者提供不同的天氣、物流、文化等資訊。很多網站對于不同區域的使用者提供了不同的通路内容,這些網站往往就是通過IP位址來确定使用者的地域資訊的
(3)區域化的廣告投放。很多商家需要精準的廣告投放,這就依賴于IP位址庫的準确性。
(4)CDN排程系統希望将各區域的使用者通路流量排程到最近的CDN節點,這點也依賴于IP位址庫的準确性
(5)網站通路品質監測。 為了準确的提供各區域使用者通路網站的品質,我們需要比較精确地知道通路使用者所在的區域,這一點目前主要也是依靠IP位址庫來實作的
IP位址庫内容
IP位址庫主要提供的是IP位址同下列一些常見資訊的對應關系:
(1)國家、大區、省/州/區、(地級)市、縣(級市)等地域資訊
(2)ISP資訊
(3)機構資訊
(4)經、緯度
(5)詳細位址
(6)路由資訊
IP位址庫的來源
現有很多的IP位址庫,各IP庫在提供者、提供資訊等方面都比較相近,常見的有:
(1)APNIC(Asia-Pacific Network Information Center),亞太網際網路絡資訊中心相關資源
IP位址段配置設定每日更新檔案
http://ftp.apnic.net/apnic/stats/apnic/delegated-apnic-latest
whois服務友善了使用者對NIC域名資料庫的查詢
(2)QQ純真庫 http://www.cz88.net/fox/
(3)IPInfodb http://ipinfodb.com/download.php?file=ipinfodb_one_table_full.sql.bz2
(4)MaxMind GeoIP http://geolite.maxmind.com/download/geoip/database/GeoLiteCity_CSV/GeoLiteCity_20100401.zip
IP位址庫評價名額
如何評價一個IP位址庫的優劣,個人覺得目前主要檢視以下幾個名額:
(1)粒度。所謂粒度,指的是IP位址庫中IP(段)對應的其他資訊的精确程度。例如,是精确到國家,還是能精确到市或縣?不同的應用對IP位址庫的粒度要求是不同的,但就IP位址庫自身的評價名額來說,粒度越細,IP位址庫的價值越大
(2)準确度。所謂準确度,指的是所提供資訊的正确的程度,顯然,準确度越高,IP位址庫的價值越大
(3)覆寫度。所謂覆寫度,指的是對一個特定的集合,IP位址庫涵蓋該結合的程度。例如,中國IP(ipv4)位址有3.1億,某IP位址庫中含有中國的IP位址數為2.8億,則覆寫度約為90%。顯而易見,覆寫度越高,IP位址庫越好
IP位址庫的內建
不同的IP位址庫在資訊粒度、置信度、覆寫度等方面各有千秋,我們可以考慮将不同IP位址庫的資訊進行內建,原則上将,這樣就能得到一個更好的IP位址庫,這也是我們目前采用的思路