優酷真實視訊位址解析——2016年9月20日
沒時間跟優酷肛啊,投奔youtube-dl了。項目位址為https://github.com/rg3/youtube-dl
如果另有用途,比如隻想拿到真實位址而不下載下傳,可參考以下C#代碼:
public string[] getRealUrlUsingYoutubeDL(string YoukuUrl)
{
string fileName = @"youtube-dl.exe";
Process p = new Process();
p.StartInfo.UseShellExecute = false;
p.StartInfo.RedirectStandardOutput = true;
p.StartInfo.FileName = fileName;
p.StartInfo.CreateNoWindow = true;
p.StartInfo.Arguments = string.Format(" --get-url --skip-download {0}", YoukuUrl);
p.Start();
p.WaitForExit(5000);//親測,youtube-dl會因為不知道什麼原因阻塞。。
string output = p.StandardOutput.ReadToEnd();
return output.Split('\n');//最後一個是"",自己處理吧
}
順便一提,騰訊視訊、樂視、愛奇藝、搜狐、新浪什麼的都可以這麼處理。
=================================================我是分割線,以下是2015年的解析方法=============================================
序:優酷之前更新了次算法(很久之前了,呵呵。。。),故此很多部落格的解析算法已經無法使用。很多大牛也已經更新了新的解析方法。我也在此寫篇解析過程的文章。(本文使用語言為C#)
由于優酷視訊位址時間限制,在你通路本篇文章時,下面所屬連結有可能已經失效,望見諒。
例:http://v.youku.com/v_show/id_XNzk2NTI0MzMy.html
1:擷取視訊vid
在視訊url中标紅部分。一個正規表達式即可擷取。
1 string getVid(string url)
2 {
3 string strRegex = "(?<=id_)(\\w+)";
4 Regex reg = new Regex(strRegex);
5 Match match = reg.Match(url);
6 return match.ToString();
7 }
2:擷取視訊元資訊
http://v.youku.com/player/getPlayList/VideoIDS/XNzk2NTI0MzMy/Pf/4/ctype/12/ev/1
将前述vid嵌入到上面url中通路即可得到視訊資訊檔案。由于視訊資訊過長不在此貼出全部内容。下面是部分重要内容的展示。(擷取檔案為json檔案,可直接解析)
1 { "data": [ {
2 "ip": 996949050,
3 "ep": "NQXRTAodIbrd1vnC8+JxB4emuRs41w7DWho=",
4 "segs": {
5 "hd2": [
6 {
7 "no": "0",
8 "size": "34602810",
9 "seconds": 205,
10 "k": "248fe14b4c1b37302411f67a",
11 "k2": "1c8e113cecad924c5"
12 },
13 {
14 "no": "1",
15 },] }, } ],}
上面顯示的内容後面都會使用到。其中segs包含hd3,hd2,flv,mp4,3gp等各種格式,并且每種格式下均分為若幹段。本次選用清晰度較高的hd2(視訊格式為flv)
3:拼接m3u8位址
http://pl.youku.com/playlist/m3u8?ctype=12&ep={0}&ev=1&keyframe=1&oip={1}&sid={2}&token={3}&type={4}&vid={5}
以上共有6個參數,其中vid和oip已經得到,分别之前的vid和json檔案中的ip字段,即(XNzk2NTI0MzMy和1991941296),但是ep,sid,token需要重新計算(json檔案中的ep值不能直接使用)。type即為之前選擇的segs。
3.1計算ep,sid,token
計算方法單純的為數學計算,下面給出計算的函數。三個參數可一次性計算得到。其中涉及到Base64編碼解碼知識,點選檢視。
1 private static string myEncoder(string a, byte[] c, bool isToBase64)
2 {
3 string result = "";
4 List<Byte> bytesR = new List<byte>();
5 int f = 0, h = 0, q = 0;
6 int[] b = new int[256];
7 for (int i = 0; i < 256; i++)
8 b[i] = i;
9 while (h < 256)
10 {
11 f = (f + b[h] + a[h % a.Length]) % 256;
12 int temp = b[h];
13 b[h] = b[f];
14 b[f] = temp;
15 h++;
16 }
17 f = 0; h = 0; q = 0;
18 while (q < c.Length)
19 {
20 h = (h + 1) % 256;
21 f = (f + b[h]) % 256;
22 int temp = b[h];
23 b[h] = b[f];
24 b[f] = temp;
25 byte[] bytes = new byte[] { (byte)(c[q] ^ b[(b[h] + b[f]) % 256]) };
26 bytesR.Add(bytes[0]);
27 result += System.Text.ASCIIEncoding.ASCII.GetString(bytes);
28 q++;
29 }
30 if (isToBase64)
31 {
32 Byte[] byteR = bytesR.ToArray();
33 result = Convert.ToBase64String(byteR);
34 }
35 return result;
36 }
37 public static void getEp(string vid, string ep, ref string pNew, ref string token, ref string sid)
38 {
39 string template1 = "becaf9be";
40 string template2 = "bf7e5f01";
41 byte[] bytes = Convert.FromBase64String(ep);
42 ep = System.Text.ASCIIEncoding.ASCII.GetString(bytes);
43 string temp = myEncoder(template1, bytes, false);
44 string[] part = temp.Split('_');
45 sid = part[0];
46 token = part[1];
47 string whole = string.Format("{0}_{1}_{2}", sid, vid, token);
48 byte[] newbytes = System.Text.ASCIIEncoding.ASCII.GetBytes(whole);
49 epNew = myEncoder(template2, newbytes, true);
50 }
計算得到ep,token,sid分别為cCaVGE6OUc8H4ircjj8bMiuwdH8KXJZ0vESH/7YbAMZuNaHQmjbTwg==, 3825, 241273717793612e7b085。注意,此時ep并不能直接拼接到url中,需要對此做一下url編碼ToUrlEncode(ep)。最終ep為cCaVGE6OUc8H4ircjj8bMiuwdH8KXJZ0vESH%2f7YbAMZuNaHQmjbTwg%3d%3d
3.2視訊格式及清晰度
視訊格式和選擇的segs有密切關系。如本文選擇的hd2,格式即為flv,下面是segs,視訊格式和清晰度的對照。之前對此部分了解有些偏差,多謝削着蘋果走路提醒。
“segs”,”視訊格式”,”清晰度”
"hd3", "flv", "1080P"
"hd2", "flv", "超清"
"mp4", "mp4", "高清"
"flvhd", "flv", "高清"
"flv", "flv", "标清"
"3gphd", "3gp", "高清"
3.3拼接位址
最後的m3u8位址為
http://pl.youku.com/playlist/m3u8?ctype=12&ep=cCaVGE6OUc8H4ircjj8bMiuwdH8KXJZ0vESH%2f7YbAMZuNaHQmjbTwg%3d%3d&ev=1&keyframe=1&oip=996949050&sid=241273717793612e7b085&token=3825&type=hd2&vid=XNzk2NTI0MzMy
4:擷取視訊位址
将上述m3u8檔案下載下傳後,其中内容即為真實位址,不過還需要稍微處理一下。部分内容如下:
1 #EXTM3U
2 #EXT-X-TARGETDURATION:12
3 #EXT-X-VERSION:3
4 #EXTINF:6.006,
5 http://59.108.137.14/65666E0ED34581E6B96293A18/0300010F005430BCBA49631468DEFEC61C5678-3A78-37BA-1971-21A0D4EEA0E7.flv?ts_start=0&ts_end=5.906&ts_seg_no=0&ts_keyframe=1
6 #EXTINF:5.464,
7 http://59.108.137.14/65666E0ED34581E6B96293A18/0300010F005430BCBA49631468DEFEC61C5678-3A78-37BA-1971-21A0D4EEA0E7.flv?ts_start=5.906&ts_end=11.37&ts_seg_no=1&ts_keyframe=1
8 #EXTINF:5.505,
9 http://59.108.137.14/65666E0ED34581E6B96293A18/0300010F005430BCBA49631468DEFEC61C5678-3A78-37BA-1971-21A0D4EEA0E7.flv?ts_start=11.37&ts_end=16.875&ts_seg_no=2&ts_keyframe=1
10 #EXTINF:9.26,
11 http://59.108.137.14/65666E0ED34581E6B96293A18/0300010F005430BCBA49631468DEFEC61C5678-3A78-37BA-1971-21A0D4EEA0E7.flv?ts_start=16.875&ts_end=26.135&ts_seg_no=3&ts_keyframe=1
12 #EXTINF:11.136,
13 http://59.108.137.14/65666E0ED34581E6B96293A18/0300010F005430BCBA49631468DEFEC61C5678-3A78-37BA-1971-21A0D4EEA0E7.flv?ts_start=26.135&ts_end=37.271&ts_seg_no=4&ts_keyframe=1
14 #EXTINF:8.258,
15 http://59.108.137.14/65666E0ED34581E6B96293A18/0300010F005430BCBA49631468DEFEC61C5678-3A78-37BA-1971-21A0D4EEA0E7.flv?ts_start=37.271&ts_end=45.529&ts_seg_no=5&ts_keyframe=1
16 #EXTINF:9.843,
17 http://59.108.137.14/65666E0ED34581E6B96293A18/0300010F005430BCBA49631468DEFEC61C5678-3A78-37BA-1971-21A0D4EEA0E7.flv?ts_start=45.529&ts_end=55.372&ts_seg_no=6&ts_keyframe=1
18 #EXTINF:10.26,
19 http://59.108.137.14/65666E0ED34581E6B96293A18/0300010F005430BCBA49631468DEFEC61C5678-3A78-37BA-1971-21A0D4EEA0E7.flv?ts_start=55.372&ts_end=65.632&ts_seg_no=7&ts_keyframe=1
其中每條url隻包含6s左右視訊,但是可将url中參數部分去掉即可得到實際的長度。但是每條去掉後需合并一下相同的url,如上述清單可得到url片段
http://59.108.137.14/65666E0ED34581E6B96293A18/0300010F005430BCBA49631468DEFEC61C5678-3A78-37BA-1971-21A0D4EEA0E7.flv
将m3u8中所有的url片段全部下載下傳即可大功告成。
本文位址:http://www.cnblogs.com/zhaojunjie/p/4009192.html,轉載請注明源位址。