今日头条最新视频解析方法

主要参考

  如果小伙伴们想知道视频的解析规则的话,可以看下下面这篇博客,只不过该博客举的例子是用Python,而且关于取video的id的方法已经变了,所以没办法正确解析视频了。

  参考博客

视频解析

一、读取html内容,获取videoId

这里我们通过读取html的内容,如:

http://toutiao.com/group/6631022373556453896/

通过查看网站源码我们可以看到,Js中包含有videoId

网站源码

如何获取videoId的值呢,这里我们通过正则匹配,匹配出页面中的videoId,代码如下

 Pattern pattern = Pattern.compile("videoId: '(.+)'");
 Matcher matcher = pattern.matcher(response);
 if (matcher.find()) {
    String videoId = matcher.group(1);
    ...
 }

切记videoId:后面带有一个空格,如果少了则匹配不到,笔者我也因为这个郁闷了很久,最后发现原来是少了一个空格。

二、构造r和s参数

参数r是一个随机数,多少位数都可以,这里我们生成一个16位的随机数:

    String r = getRandom(); //7805700526977788
   
    //生成16位的随机数
    private String getRandom() {
        Random random = new Random();
        StringBuilder result = new StringBuilder();
        for (int i = 0; i < 16; i++) {
            result.append(random.nextInt(10));
        }
        return result.toString();
    }

参数s是通过CRC32加密过的,加密的原文规则为:

/video/urls/v/1/toutiao/mp4/videoid?r=随机数

如上面例子,videoId 为 v02004040000bg31ot72gddgigkg7kvg

r 为 7805700526977788

那么加密的原文为:

/video/urls/v/1/toutiao/mp4/v02004040000bg31ot72gddgigkg7kvg?r=7805700526977788

参数s的生成代码如下:

 CRC32 crc32 = new CRC32();
 String s = String.format(ApiConstant.URL_VIDEO, videoId, r);
 //进行crc32加密。
 crc32.update(s.getBytes());
 String crcString = crc32.getValue() + ""; //38456043
 public static final String URL_VIDEO="/video/urls/v/1/toutiao/mp4/%s?r=%s";

发起获取视频地址的请求

有了上面的videoId以及r和s参数,我们就可以发起获取视频真正地址的请求了,请求的方式为:

http://i.snssdk.com/video/urls/v/1/toutiao/mp4/videoid?r=随机数&s=CRC32密文

上面例子构建的链接为:

http://i.snssdk.com/video/urls/v/1/toutiao/mp4/v02004040000bg31ot72gddgigkg7kvg?r=7805700526977788&s=38456043

请求获取到的json如下图:

获取视频的json

  这里有一个video_list节点,里面会有video_1、video_2、video_3,这里演示的里面只有一个video_1,其中video节点中的main_url就是视频的真实地址,只不过是通过base64加密过,这里我们需要对其进行解密:

private String getRealPath(String base64) {
    return new String(Base64.decode(base64.getBytes(), Base64.DEFAULT));
}

解密后,获取到视频的真实地址为:

http://v6-tt.ixigua.com/video/m/22043d51290e6704a048ae8f386f721975f11610ea5d000060fe86e532c7/?AWSAccessKeyId=qh0h9TdcEMoS2oPj7aKX&Expires=1543982822&Signature=GVgJXs4mzAIGAXqr6VgaoORAat8%3D&rc=am5qampnNXc0ajMzNzczM0ApQHRAbzw4OTg6MzUzMzgzNDM0NDVvQGgzdSlAZjN1KWRzcmd5a3VyZ3lybHh3ZjUzQHM0aGZhZDRsMF8tLS0tL3NzLW8jbyMyMjIuMzItLjIyLjIvNS06I28jOmEtcSM6YHZpXGJmK2BeYmYrXnFsOiMuL14%3D

至此,解析今日头条的方法已经分析完毕,如果大家想要查看源码的话,可以参考我的项目(文章末尾处),同时也希望如果帮到你的话,请帮我star下,多谢了。

具体的代码在里面解析视频那块,即VideoPathDecoder类的decodePath方法中:

解析视频的代码

源码地址

精仿今日头条

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 215,539评论 6 497
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,911评论 3 391
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 161,337评论 0 351
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,723评论 1 290
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,795评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,762评论 1 294
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,742评论 3 416
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,508评论 0 271
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,954评论 1 308
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,247评论 2 331
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,404评论 1 345
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,104评论 5 340
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,736评论 3 324
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,352评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,557评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,371评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,292评论 2 352

推荐阅读更多精彩内容