python 爬取一些数据,存入数据库 并生成简单图表

前言

爬取豆瓣的 top250 电影榜

环境

请自行 安装python 需要的包
BeautifulSoup
MySQL-python

开始
创建一个py文件 demo3.py

分析页面结构

1.png

导入一些包


2.png

定义一个DouBanSpider类以及一些方法

3.png
4.png
5.png
6.png

运行

>>> python demo3.py
7.png

创建一个用于生成chart的 py文件, showdata1.py

请自行 安装python 需要的包
pygal
MySQL-python
Flask

8.png

9.png
10.png
11.png

小例子

#!/usr/bin/python
#coding=utf-8
import pygal
import json
from urllib2 import urlopen  # python 2 syntax
# from urllib.request import urlopen # python 3 syntax
import MySQLdb


from flask import Flask
from pygal.style import DarkSolarizedStyle
import sys,os
reload(sys)
sys.setdefaultencoding('utf8')

app = Flask(__name__)

#----------------------------------------------------------------------
@app.route('/dbmovies')
def demoDBMovies():
    try:
        conn = MySQLdb.connect(host='localhost',user='hejing',passwd='hejing',db='books',charset='utf8')
    except Exception, e:
        print e
        sys.exit()
    cursor = conn.cursor()
    sql = "select * from books order by people DESC LIMIT 10"
    cursor.execute(sql)
    alldata = cursor.fetchall()

    title = " This is a testing demo"
    line_chart = pygal.HorizontalBar()
    line_chart.title = 'Best Top 10 movies in Douban'
    
    if alldata:
        for rec in alldata:
            #print rec[0], rec[1]
            line_chart.add(rec[0], rec[1])

    cursor.close()
    conn.close()

    html = """
        <html>
             <head>
                  <title>%s</title>
             </head>
              <body>
                 %s
             </body>
        </html>
        """ % (title, line_chart.render())
    return html
#----------------------------------------------------------------------
if __name__ == '__main__':
    app.run(host='127.0.0.1')
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容