登录注册写文章

python爬虫凤凰网新闻

python爬虫凤凰网新闻

首先使用chrome浏览器，找到网页要爬取内容的代码，鼠标选中，右键，选择菜单项“检查”

之后，就会在页面下方该选中位置的源代码，

这时，就可以查看class, p, title等标签。写python代码进行爬取了。

爬取凤凰新闻页面的新闻标题，简介，时间和链接。

代码如下：

import requests

from bs4 import BeautifulSoup

web_data =requests.get('http://news.ifeng.com/listpage/101231/1/list.shtml')

soup = BeautifulSoup(web_data.text,'lxml')

a = 1

for data in soup.select('.box_list'):

detail =data.select('.box_txt p')[0].text

time =data.select('span')[0].text

title =data.select('h2 a')[0]['title']

link =data.select('h2 a ')[0]['href']

print('%d.'%a,title,link,detail,time)

a = a+1

print("新闻条数:",a-1)

爬取截图如下：

最后编辑于：2017.12.11 05:30:24

©著作权归作者所有,转载或内容合作请联系作者
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

推荐阅读更多精彩内容

python爬虫里信息提取的核心方法: Beautifulsoup Xpath 正则表达式
20170531 这几天重新拾起了爬虫，算起来有将近5个月不碰python爬虫了。对照着网上的程序和自己以前写的...
八神苍月阅读 14,257评论 3赞 44
python实战计划：爬取租房信息
Date:2016-9-21update:2016-9-30By:Black Crow 前言：终于进入到网络页面...
black_crow阅读 879评论 0赞 2
Python爬虫之Beautiful Soup用法
关于bs4，官方文档的介绍已经非常详细了,传送：Beautifulsoup 4官方文档,这里我把它组织成自己已经消...
徐薇薇阅读 5,470评论 0赞 1
iOS Base64编码
今天突然想起了base64编码加密,然后就整理了一下,虽然用的不多,但了解多一点并无坏处~ 一、简介是网络上使用...
Lin_梓明阅读 2,855评论 0赞 2
我家先生
这是个跟我没什么关系的故事。从前不觉得，先生，是一个多么有内容的词，只不过是服务行业人员冷着脸对雄性人类的统称，...
我叫唐三角阅读 777评论 10赞 6

赞1赞

赞赏

手机看全文