编程探险家

这个屌丝很懒，什么也没留下！

热门标签

flask+echarts+mysql_实战|Python爬虫并用Flask框架搭建可视化网站

作者：编程探险家 | 2024-01-31 18:57:22

踩

flask+python+echarts url:'/query

大家好，我是J哥，也可以叫我菜J，专注原创，致力于用浅显易懂的语言分享网络爬虫、数据分析、可视化等干货，希望人人都能学到新知识。 项目背景 事情是这样的，最近呢，一直有朋友问我有没有什么办法将每天获得的最新数据进行可视化，并且实现可视化图表自动更新，解放双手。

尤其对于金融行业，如果可以将每天获得的关键行情指标数据自建模型，然后将结果可视化至私有平台，实现每日更新，那确实是一件挺有意思的事情。

这不，这位金融大佬就找到了我：

其实解决的方案挺多，J哥简单总结了下：

OK，分析完优缺点，那咱就开始实操吧。本文以爬取豆瓣电影数据并搭建可视化网站为例进行讲解，考虑到很多朋友是结果导向心理，那就先看下最终实现的效果吧。

首先，看下可视化网站首页，长这样：

其次，简单用动画演示下可视化网站：

项目实操 J哥一直以来坚信实践来源于理论，要想用Python实现以上可视化网站效果，咱必须首先搞懂其中原理和方法。于是，作为灵魂画手的J哥，又悄悄拿起了画笔。

怎么样，这次的图比之前文章里的画的好吧。

理论部分讲完了，还是作图舒服，简单，直接。既然原理搞明白了，接下来就是一步步去实现了。一获取数据获取数据的方法很多，J哥更喜欢自己动手，写写爬虫脚本。本次项目数据来源为以下网站。

具体的爬虫怎么写，我这不做赘述，因为是简单的静态网页，你查看本公众号历史文章《实战|手把手教你用Python爬虫(附详细源码) 》，自然而然就知道怎么搞了。

不过考虑到有些朋友还没入门，J哥还是啰嗦一句。由于url中的start参数表示每增加25翻页一次，而翻10次就可以获取到豆瓣电影TOP250数据，所以，你要这样构建url：

1#爬取网页2baseurl = "https://movie.douban.com/top250?start="3def getData(baseurl):4    datalist = []5    for i in range(0,10):    #调用获取页面信息的函数，10次6        url = baseurl + str(i*25)

二存储数据数据爬下来之后，咱们得存储下来。一般的存储方式有csv、excel等，而J哥强烈建议存储到Mysql数据库。这个数据库开源好用，入门也极其简单，感兴趣的朋友可关注本公众号，从后台自动获取Mysql入门教程。咱们继续回到Python中来，安装并导入pymysql库以便对Mysql进行各种操作：

1import pymysql    #进行Mysql数据库操作

在数据库test中创建movie表，代码如下：

 1def mysql_create(): 2    conn = pymysql.connect(host="localhost", user="你的", passwd="你的", db="test", port=3306, charset="utf8") 3 4    # 获取游标 5    cur = conn.cursor() 6 7    # 创建表sql语句 8    sql_create = """ 9                       create table movie10                        (11                        id INTEGER  PRIMARY KEY AUTO_INCREMENT,   #自增、主键注意字段属性必须大写12                        info_link TEXT,13                        pic_link TEXT,14                        cname VARCHAR(100),15                        ename VARCHAR(100),16                        score DECIMAL(10,2),17                        rated INTEGER,18                        instroduction TEXT,19                        info TEXT20                        )    21            """22    # 执行创建表sql语句23    cur.execute(sql_create)24    conn.commit()25    cur.close()26    conn.close()

把爬取的数据写入movie表中：

 1#3、保存数据 2def saveData2DB(datalist): 3    mysql_create() 4    conn = pymysql.connect(host="localhost", user="你的", passwd="你的", db="test", port=3306, charset="utf8") 5    cur = conn.cursor() 6    for data in datalist: 7        for index in range(len(data)): 8            data[index] = '"'+data[index]+'"'  #每个数据加上双引号 9        sql = '''  #注意空格，这个sql要在for data in datalist:下遍历10                insert into movie(11                info_link,pic_link,cname,ename,score,rated,instroduction,info)12                values(%s)'''%",".join(data)    #",".join表示把数据连接并以逗号分隔13        print(sql)   #先打印下sql看下有没有问题14        cur.execute(sql)15        conn.commit()16    cur.close()17    conn.close()

咱们用Mysql的图形化界面Navicat打开下这个movie表，截取部分，长这样：

三选择web框架 Python最为流行的web框架莫过于Django和Flask了，而两者的区别，J哥也找了很多文章去了解，大致总结为一句话：Django大而全，Flask小而灵活。做了对比之后，J哥最终选择了Flask框架来做这个可视化网站。专业版PyCharm可以直接创建Flask项目，但J哥比较菜，还没那么专业，所以还是用的社区版。

不过问题也不大，咱自己创建Flask框架中的app.py文件、static文件以及templates文件也行呀。templates是前端网页模板，static是对templates的样式设置，app.py控制用户的请求和数据的返还。

那J哥就举个可能不太恰当的栗子，templates是素颜，static是美颜，而app.py是朋友圈。

我们来看看app.py长啥样：

 1#-*- coding = uft-8 -*- 2#@Time : 2020/5/24 11:57 上午 3#@Author : 菜J学Python 4#@File : app.py 5 6from flask import Flask,render_template 7 8app = Flask(__name__) 910@app.route("/index")11def index():12    return render_template("index.html")1314if __name__ == '__main__':15    app.run(debug=True)

你没看错，Flask框架就这么简单。route是路由，用来控制用户的请求，index函数用来返还给用户网页数据，以上是返还了一个主页index.html。注意要开启debug模式，否则你代码出错了很难找到原因。接下来，我以制作score.html为例来具体介绍怎么实现的，也就是这个网页：

我从网上download了一个免费的Bootstrap前端模板，这样网页的结构、颜色等就不用自己搞了，当然前端大佬可以考虑自己写。在模板中找了个html，把没用的内容全删掉，留下可以放图表的位置。

接着，在score.html中加入图表，我这里采用的是Echarts的模板。

制作Echarts图表要先下载echarts.min.js文件，建议根据自己的需要在线定制下载，因为默认全部下载的话太大啦，大概率下载失败！！！下载完后，把它放在static文件夹里的js子目录。

咱们打开score.html，开始制作柱状图。首先把 echarts.min.js 引入进来：

接着，我们需要为柱状图准备一个具备高宽的 DOM 容器。

然后，我们就可以通过 echarts.init 方法初始化一个 echarts 实例并通过 setOption 方法生成一个简单的柱状图，其实就是加个script。

其他任何图表制作方法都类似，直接去Echarts官网copy它们的stript就好啦，咱们主要负责给图表传数据。四调用数据

眼尖的朋友可能已经发现我那柱状图stript里的两个data就是横纵坐标的数据，数据类型为list。Echarts官网默认给的数据我用注释掉了。而data里的score和num正是通过app.py调用的Mysql里的movie表数据。

@app.route("/score")def score():    score = [] #评分    num = [] #每个评分所统计出的电影数量    conn = pymysql.connect(host="localhost", user="你的", passwd="你的", db="test", port=3306, charset="utf8")    cur = conn.cursor()    sql = "select score,count(score) from movie group by score;"    cur.execute(sql)    data = cur.fetchall()   #mysql必须    for item in data:        score.append(item[0])        num.append(item[1])    cur.close()    conn.close()    return  render_template("/score.html",score=score,num=num)

柱状图stript里的store要转为json格式，否则前端显示会乱码，至此score.html就做完啦。你可以在一个html里添加多张图，无非就是多写几个sql语句罢了。但要注意不同图表要定义不同的id，否则前端只能显示一张图。举一反三，咱就可以很方便的制作其他网页了。无非就是加图表，写sql传数据，加图表，写sql传数据重复操作罢了。

最后，就是在主页中给相应的内容添加href属性，以实现点击对应的栏目可以跳转到对应的网页。

至此，本地化的Flask框架制作的可视化网站搭建完成。五服务器部署

通过以上方法制作的网站你可以在自己的电脑里查看，只要每天运行下爬虫代码，你的网站内容就会实现自动更新啦。但如果你想要发布到互联网，随时随地让自己和别人查看，你还得把项目部署到服务器上，并给爬虫设置定时。你才可以实现每天躺着吃瓜，开心地看着你的网站自动更新。

限于篇幅，本文暂不作服务器的购买、配置以及项目部署等操作介绍，感兴趣的朋友可以关注下此号，后续会有相关讲解，精彩不容错过哦~ 结语 Flask框架入门较简单，也比较轻巧灵活，很适合个人或者小团队快速搭建网站玩。但如果你要搭建大型的电商平台或者资讯平台，还是建议你学学Django，J哥最近也打算搞搞Django，毕竟也是有一颗好奇的心。最后，如果你在搭建Flask框架的时候遇到问题，可以后台加我WeChat，菜J也想学习下你的bug。

往期回顾

实战|Python轻松实现动态网页爬虫(附详细源码)
实战|Python轻松实现地图可视化(附详细源码)
实战|Python轻松实现PDF格式转换(附详细源码)
实战|Python轻松实现批量图片文字识别(附详细源码)
实战|手把手教你用Python爬虫(附详细源码)
实战|Python轻松实现绘制词云图(附详细源码)

声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：【wpsshop博客】