cheerio


1.###简介
cheerio 就是在nodejs中用jquery的方式解析dom
Cheerio 几乎能够解析任何的 HTML 和 XML document

2.###例子
var cheerio = require('cheerio'),
    $ = cheerio.load('<h2 class="title">Hello world</h2>');

$('h2.title').text('Hello there!');
$('h2').addClass('welcome');

$.html();
//=> <h2 class="title welcome">Hello there!</h2>




3.###加载
 <ul id="fruits">
    <li class="apple">Apple</li>
    <li class="orange">Orange</li>
    <li class="pear">Pear</li>
 </ul>
《1》
    var cheerio = require('cheerio'),
    $ = cheerio.load('<ul id="fruits">...</ul>');

《2》???
    或者通过传递字符串作为内容来加载HTML:
    $ = require('cheerio');
    $('ul', '<ul id="fruits">...</ul>');
《3》???
    或者作为根节点
    $ = require('cheerio');
    $('li', 'ul', '<ul id="fruits">...</ul>');
《4》
    你也可以传递一个额外的对象给.load()如果你需要更改任何的默认解析选项的话:
    $ = cheerio.load('<ul id="fruits">...</ul>', {
        ignoreWhitespace: true,
        xmlMode: true
    });
    这些解析选项都是直接来自htmlparser ,因此任何在htmlparser里有效的选项在Chreeio里也是行得通的。默认的选项如下:
    {
        ignoreWhitespace: false,
        xmlMode: false,
        lowerCaseTags: false
    }

4.###Selectors选择器
    $(selectior,[context],[root])
    选择器在 Context 范围内搜索,Context又在Root范围内搜索。selector 和context可是是一个字符串表达式,DOM元素,和DOM元素的数组,或者chreeio对象。root 是通常是HTML 文档字符串。
《2》注意'#fruits'是搜索的范围
    $('.apple', '#fruits').text()
    //=> Apple

    $('ul .pear').attr('class')
    //=> pear

    $('li[class=orange]').html()
    //=> <li class="orange">Orange</li>


5.####Attributes 获得和修改属性
    .attr(name,value)

    获得和修改属性。在匹配的元素中只能获得第一元素的属性。如果设置一个属性的值为null,则移除这个属性。你也可以传递一对键值,或者一个函数。

    $('ul').attr('id')
    //=> fruits

    $('.apple').attr('id', 'favorite').html()
    //=> <li class="apple" id="favorite">Apple</li>

6.value([value])
    获得和修改input,select,textarea的value.注意: 对于传递键值和函数的支持还没有被加进去。

    $('input[type="text"]').val()
    => input_text

    $('input[type="text"]').val('test').html()
    => <input type="text" value="test"/>

7.removeAttr(name) 通过name删除属性
    $('.pear').removeAttr('class').html()
    //=> <li>Pear</li>

8.class操作
《1》hasClass( className ) 检查匹配的元素是否有给出的类名
    $('.pear').hasClass('pear')
    //=> true
    $('apple').hasClass('fruit')
    //=> false
    $('li').hasClass('pear')
    //=> true
    
《2》removeClass([className])
    从选择的elements里去除一个或多个有空格分开的class。如果className 没有定义,所有的classes将会被去除,也可以传函数。

    $('.pear').removeClass('pear').html()
    //=> <li class="">Pear</li>

    $('.apple').addClass('red').removeClass().html()
    //=> <li class="">Apple</li>
《3》.addClass(className)
    增加class(es)给所有匹配的elements.也可以传函数。
    $('.pear').addClass('fruit').html()
    //=> <li class="pear fruit">Pear</li>
    $('.apple').addClass('fruit red').html()
    //=> <li class="apple fruit red">Apple</li>

9.????
    .is.(selector)

    .is(function(index))

    有任何元素匹配selector就返回true。如果使用判定函数,判定函数在选中的元素中执行,所以this指向当前的元素。


10.####Traversing 遍历

《1》.find(selector)获得一个在匹配的元素中由选择器滤过的后代。
    $('#fruits').find('li').length
    //=> 3
    
《2》.parent([selector])
    获得每个匹配元素的parent,可选择性的通过selector筛选。
    $('.pear').parent().attr('id')
    //=> fruits
    
《3》.parents([selector])
    获得通过选择器筛选匹配的元素的parent集合。
    $('.orange').parents().length
    // => 2
    $('.orange').parents('#fruits').length
    // => 1

《4》.closest([selector])
    对于每个集合内的元素,通过测试这个元素和DOM层级关系上的祖先元素,获得第一个匹配的元素
    $('.orange').closest()
    // => []
    $('.orange').closest('.apple')
    // => []
    $('.orange').closest('li')
    // => [<li class="orange">Orange</li>]
    $('.orange').closest('#fruits')
    // => [<ul id="fruits"> ... </ul>]

《5》.next()
    获得第一个本元素之后的同级元素
    $('.apple').next().hasClass('orange')
    //=> true

《6》nextAll()
    获得本元素之后的所有同级元素
    $('.apple').nextAll()
    //=> [<li class="orange">Orange</li>, <li class="pear">Pear</li>]
    
《7》.prev()
    获得本元素之前的第一个同级元素
    $('.orange').prev().hasClass('apple')
    //=> true
    
《8》.preAll()
    $('.pear').prevAll()
    //=> [<li class="orange">Orange</li>, <li class="apple">Apple</li>]
    获得本元素前的所有同级元素

《9》.slice(start,[end])
    获得选定范围内的元素
    $('li').slice(1).eq(0).text()
    //=> 'Orange'
    $('li').slice(1, 2).length
    //=> 1

《10》.siblings(selector)
    获得被选择的同级元素,除去自己
    $('.pear').siblings().length
    //=> 2
    $('.pear').siblings('.orange').length
    //=> 1
《11》.children(selector)
    获被选择元素的子元素
    $('#fruits').children().length
    //=> 3
    $('#fruits').children('.pear').text()
    //=> Pear
《12》.each(function(index,element))
    迭代一个cheerio对象,为每个匹配元素执行一个函数。When the callback is fired, the function is fired in the context of the DOM element, so this refers to the current element, which is equivalent to the function parameter element.要提早跳出循环,返回false.
    var fruits = [];
    $('li').each(function(i, elem) {
      fruits[i] = $(this).text();
    });
    fruits.join(', ');
    //=> Apple, Orange, Pear
    
《13》.map(function(index,element))
    迭代一个cheerio对象,为每个匹配元素执行一个函数。Map会返回一个迭代结果的数组。the function is fired in the context of the DOM element, so this refers to the current element, which is equivalent to the function parameter element

    $('li').map(function(i, el) {
      // this === el
      return $(this).attr('class');
    }).join(', ');
    //=> apple, orange, pear
    
《14》.filter(selector)
    .filter(function(index))
    迭代一个cheerio对象,滤出匹配选择器或者是传进去的函数的元素。如果使用函数方法,这个函数在被选择的元素中执行,所以this指向的手势当前元素。

    Selector:
    $('li').filter('.orange').attr('class');
    //=> orange
    Function:
    $('li').filter(function(i, el) {
      // this === el
      return $(this).attr('class') === 'orange';
    }).attr('class')
    //=> orange
    
《15》.first()
    会选择chreeio对象的第一个元素

    $('#fruits').children().first().text()
    //=> Apple
    
《16》.last()

    $('#fruits').children().last().text()
    //=> Pear
    会选择chreeio对象的最后一个元素

《17》.eq(i)

    通过索引筛选匹配的元素。使用.eq(-i)就从最后一个元素向前数。
    $('li').eq(0).text()
    //=> Apple
    $('li').eq(-1).text()
    //=> Pear

11.###Manipulation 改变DOM结构的方法

《1》.append(content,[content…])
    在每个元素最后插入一个子元素

    $('ul').append('<li class="plum">Plum</li>')
    $.html()
    //=>  <ul id="fruits">
    //      <li class="apple">Apple</li>
    //      <li class="orange">Orange</li>
    //      <li class="pear">Pear</li>
    //      <li class="plum">Plum</li>
    //    </ul>
    
《2》.prepend(content,[content,…])
    在每个元素最前插入一个子元素

    $('ul').prepend('<li class="plum">Plum</li>')
    $.html()
    //=>  <ul id="fruits">
    //      <li class="plum">Plum</li>
    //      <li class="apple">Apple</li>
    //      <li class="orange">Orange</li>
    //      <li class="pear">Pear</li>
    //    </ul>
    
《3》.after(content,[content,…])
    在每个匹配元素之后插入一个元素

    $('.apple').after('<li class="plum">Plum</li>')
    $.html()
    //=>  <ul id="fruits">
    //      <li class="apple">Apple</li>
    //      <li class="plum">Plum</li>
    //      <li class="orange">Orange</li>
    //      <li class="pear">Pear</li>
    //    </ul>
    
《4》.before(content,[content,…])
    在每个匹配的元素之前插入一个元素

    $('.apple').before('<li class="plum">Plum</li>')
    $.html()
    //=>  <ul id="fruits">
    //      <li class="plum">Plum</li>
    //      <li class="apple">Apple</li>
    //      <li class="orange">Orange</li>
    //      <li class="pear">Pear</li>
    //    </ul>
    
《5》.remove( [selector] )
    从DOM中去除匹配的元素和它们的子元素。选择器用来筛选要删除的元素。

    $('.pear').remove()
    $.html()
    //=>  <ul id="fruits">
    //      <li class="apple">Apple</li>
    //      <li class="orange">Orange</li>
    //    </ul>
    
《6》.replaceWith( content )
    替换匹配的的元素

    var plum = $('<li class="plum">Plum</li>')
    $('.pear').replaceWith(plum)
    $.html()
    //=> <ul id="fruits">
    //     <li class="apple">Apple</li>
    //     <li class="orange">Orange</li>
    //     <li class="plum">Plum</li>
    //   </ul>
    
《7》.empty()
    清空一个元素,移除所有的子元素

    $('ul').empty()
    $.html()
    //=>  <ul id="fruits"></ul>
    
《8》.html( [htmlString] )
    获得元素的HTML字符串。如果htmlString有内容的话,将会替代原来的HTML

    $('.orange').html()
    //=> Orange
    $('#fruits').html('<li class="mango">Mango</li>').html()
    //=> <li class="mango">Mango</li>
    
《9》.text( [textString] )
    获得元素的text内容,包括子元素。如果textString被指定的话,每个元素的text内容都会被替换。

    $('.orange').text()
    //=> Orange

    $('ul').text()
    //=>  Apple
    //    Orange
    //    Pear
    
11.###Rendering 如果你想呈送document,你能使用html多效用函数。 

《1》$.html()
    //=>  <ul id="fruits">
    //      <li class="apple">Apple</li>
    //      <li class="orange">Orange</li>
    //      <li class="pear">Pear</li>
    //    </ul>
    如果你想呈送outerHTML,你可以使用 $.html(selector)

《2》$.html('.pear')
    //=> <li class="pear">Pear</li>
    默认的,html会让一些标签保持开标签的状态.有时候你想呈现一个有效的XML文档.例如下面这个:

    $ = cheerio.load('<media:thumbnail url="http://www.foo.com/keyframe.jpg" width="75" height="50" time="12:05:01.123"/>');
    然后为了呈现这个XML,你需要使用xml这个函数:

《3》$.xml()
    //=>  <media:thumbnail url="http://www.foo.com/keyframe.jpg" width="75" height="50" time="12:05:01.123"/>

12.###Miscellaneous 不属于其它地方的DOM 元素方法

《1》.toArray()
    取得所有的在DOM元素,转化为数组、

    $('li').toArray()
    //=> [ {...}, {...}, {...} ]
    

《2》.clone() 克隆cheerio对象

    var moreFruit = $('#fruits').clone()
    ###Utilities

《3》$.root
    有时候你想找到最上层的root元素,那么$.root()就能获得:

    $.root().append('<ul id="vegetables"></ul>').html();
    //=> <ul id="fruits">...</ul><ul id="vegetables"></ul>
    

《4》$.contains( container, contained ) 
    查看cotained元素是否是container元素的子元素

    $.parseHTML( data [, context ] [, keepScripts ] )

    将字符串解析为DOM节点数组。context参数对chreeio没有意义,但是用来维护APi的兼容性。
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 194,761评论 5 460
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 81,953评论 2 371
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 141,998评论 0 320
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 52,248评论 1 263
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 61,130评论 4 356
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 46,145评论 1 272
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 36,550评论 3 381
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 35,236评论 0 253
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 39,510评论 1 291
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 34,601评论 2 310
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 36,376评论 1 326
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 32,247评论 3 313
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 37,613评论 3 299
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 28,911评论 0 17
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 30,191评论 1 250
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 41,532评论 2 342
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 40,739评论 2 335

推荐阅读更多精彩内容

  • 我只记得:我一生渴望被人收藏好,妥善安放,细心保存。免我惊,免我苦,免我四下流离,免我无枝可依!却忘...
    flying毛毛阅读 258评论 0 2
  • React Native NavigatorIOS API 使用 通过学习React Native的Navigat...
    MsgIM阅读 760评论 0 0
  • 如果不谈政治,我一直试图揣摩陶潜写下《归去来兮辞》时的心境,是逃避还是看破?是放下还是执着? “悟已往之不谏,知来...
    卜寸阅读 185评论 2 4