时间:2021-04-15 python教程 查看: 985
pyecharts 是一个用于生成 Echarts 图表的类库。用 Echarts 生成的图可视化效果很不错,pyecharts库是用来与 Python 进行对接,方便在 Python 中直接使用数据生成图。
最新的Pyecharts库版本是v1,且与老版本 v0.5.X 是不兼容的,v0.5.X版本也已不再维护。新旧版本的Geo有着较大改动,本篇均是基于旧版本0.5.11
pyecharts的安装说明很简单,也有很多大佬写了过程,本篇不赘述,主要说一下指定版本的问题。
安装pyecharts
Pyecharts v1版本的安装可使用pip install pyecharts -U
Pyecharts v0.5.X版本的安装可使用pip install pyecharts==0.5.11
安装对应的地图拓展
pip install echarts-countries-pypkg
pip install echarts-china-provinces-pypkg
pip install echarts-china-cities-pypkg
pip install echarts-china-counties-pypkg
pip install echarts-china-misc-pypkg
全球国家地图:echarts-countries-pypkg (1.9MB)
中国省级地图:echarts-china-provinces-pypkg (730KB)
中国市级地图:echarts-china-cities-pypkg (3.8MB)
中国区县地图:echarts-china-counties-pypkg
中国大区地图:echarts-china-misc-pypkg(如:华南、华北等)
geo=Geo()是画出地图的背景。
Geo(title,subtitle,width,height,title_pos,title_top,title_color,subtitle_color,title_text_size,subtitle_text_size,background_color,page_title,renderer,is_animation)
各参数说明如下。
实际使用过程中,我们其实经常用到的就几个参数,如title,width,height,background_color,只要搞这几个基本就够用了,所有参数都有默认值,这意味着在最极端情况下,直接用Geo()也可以,不过画出来的就是一张白纸罢了。
Init docstring:
:param title:
主标题文本,支持换行,默认为 ""
:param subtitle:
副标题文本,支持换行,默认为 ""
:param width:
画布宽度,默认为 800(px)
:param height:
画布高度,默认为 400(px)
:param title_pos:
标题距离左侧距离,默认为'left',有'auto', 'left', 'right',
'center'可选,也可为百分比或整数
:param title_top:
标题距离顶部距离,默认为'top',有'top', 'middle', 'bottom'可选,
也可为百分比或整数
:param title_color:
主标题文本颜色,默认为 '#000'
:param subtitle_color:
副标题文本颜色,默认为 '#aaa'
:param title_text_size:
主标题文本字体大小,默认为 18
:param subtitle_text_size:
副标题文本字体大小,默认为 12
:param background_color:
画布背景颜色,默认为 '#fff'
:param page_title:
指定生成的 html 文件中 <title> 标签的值。默认为 'Echarts'
:param renderer:
指定使用渲染方式,有 'svg' 和 'canvas' 可选,默认为 'canvas'。
3D 图仅能使用 'canvas'。
:param extra_html_text_label:
额外的 HTML 文本标签,(<p> 标签)。类型为 list,list[0] 为文本内容,
list[1] 为字体风格样式(选填)。如 ["this is a p label", "color:red"]
:param is_animation:
是否开启动画,默认为 True。V0.5.9+
举例子:
from pyecharts import Geo
geo =Geo("Geo地图示例", "副标题",width=500, height=500, title_pos='center',title_top=20, title_color="#2E2E2E",
subtitle_color='#aaa',title_text_size=16,subtitle_text_size=12,background_color='#EEEEE8',
page_title='Echarts',renderer='canvas',is_animation=True)
geo
geo.add_coordinate()的作用就是新增,比如现在调用一张广州地图,现在要在显示一个特定的点“测试1”,像这样的点就必须用add_coordinate新增进去,否则会报错(ValueError: No coordinate is specified for 测试1)。
geo.add_coordinate(点名称,经度,纬度),3个参数都是必填项
geo.add_coordinate('测试点1',113.40,23.07)
geo.add()的作用就是将点展示到上面加载的地图上,add有一大堆的参数,最常用的是series_name、names、value、type、maptype、is_visualmap、visual_range、visual_text_color、symbol_size,其中series_name、names、value、maptype这四个是必填项
# 系列名称,用于 tooltip 的显示,legend 的图例筛选。
series_name: str,
# 数据项 (坐标点名称)
names:list
# 数据项 (坐标点值)
value: list
# Geo 图类型,有 scatter, effectScatter, heatmap, lines 4 种
type: 默认"scatter",
# 是否选中图例
is_selected: 默认True,
# 标记图形形状,circle,pin,rect,diamon,roundRect,arrow,triangle
symbol: 默认circle,
# 标记的大小
symbol_size: 默认12,
# 系列 label 颜色
color: 默认None,
# 是否是多段线,在画 lines 图情况下
is_polyline: 默认 False,
# 是否启用大规模线图的优化,在数据图形特别多的时候(>=5k)可以开启
is_large: 默认 False,
# 特效尾迹的长度。取从 0 到 1 的值,数值越大尾迹越长。
trail_length:默认 0.2
# 地图选择,如广东、广州、china
maptype
#不知道什么作用,只知道默认Ture
is_random
#是否开启鼠标缩放和平移漫游。'scale'缩放、'move'平移、'True'都开启
is_roam:默认True
#显示图例条
is_visualmap:默认True
#图例条范围
visual_range
#图例条颜色
visual_text_color
#常态下地图的颜色
geo_normal_color
#触发下地图的颜色(鼠标放在地图上)
geo_emphasis_color
#涟漪的多少,当type="effectScatter"时才有效
effect_scale
#显示标签
is_label_show
#标签颜色
label_text_color
#标签位置(inside,top,bottom,left,right)
label_pos:默认"inside"
#边界颜色
border_color
举例子
from pyecharts import Geo
districts=['荔湾区', '花都区', '番禺区','测试点1']
value = [ 200, 200,300,400]
geo =Geo("Geo地图示例", "副标题",width=500, height=500, title_pos='center',title_top=20, title_color="#2E2E2E",
subtitle_color='#aaa',title_text_size=16,subtitle_text_size=12,background_color='#EEEEE8',
page_title='Echarts',renderer='canvas',is_animation=True)
geo.add_coordinate('测试点1',113.40,23.07)
geo.add("系列名1",
districts, value,type="effectScatter",is_selected=True,symbol='circle',symbol_size=20,color=None,
maptype='广州',is_roam=True,is_visualmap=True, visual_range=[0,500],visual_text_color="#2E2E2E",
geo_normal_color="#323c48",geo_emphasis_color='#2a033d', effect_scale=3,
is_label_show=True,label_text_color="#00FF00",label_pos="inside"
)
geo.render("广州测试2.html")
geo
在这里有2个问题还没解决。第一、不知道is_random参数的作用,感觉不管是True或False都没影响;第二、如上图的series_name “系列名1”,不知道如何改变它的位置,如移动到左边右边等。
geo.render()很简单了,就是将地图保存为文件出来,render只有一个参数,就是path路径
geo.render("广州测试2.html")
补充:Pyecharts v1 Geo库的一些更新与应用
最近在利用Python进行爬虫的过程中,需要对网页中爬取的数据做一些可视化的处理,其中有部分数据是关于地区分布的,在地图上标注出具体的参数分布将使得数据更加的直观与生动。
地图标注的工具我选择使用的是Pyecharts库中Geo,运行在Pycharm下,值得注意的是,最新的Pyecharts库版本是v1, 是最新的版本,且与老版本 v0.5.X 是不兼容的,v0.5.X版本也已不再维护,所以建议以后尽量应用最新的v1版,本文也将在此对其进行一些Geo库的更新应用的说明。
Pyecharts v1版本的安装可使用pip install pyecharts -U,也可直接在Pycharm中安装Pyecharts,其说明文档地址为https://pyecharts.org/#/zh-cn/intro
Pyecharts v0.5.X版本的安装可使用pip install pyecharts==0.5.11,其说明文档地址为https://05x-docs.pyecharts.org/#/zh-cn/prepare
新版本Pyecharts中的地理图表Geo有着较大的改动,总的一个最直观的更新感受是,新的库没有以前那么繁琐了,应用起来更简单直接。因为本人刚接触Python,很多东西也是刚刚入门,现阶段也只是达到能够初步使用Geo的程度,在探索使用新版本的过程中发现网上关于新板Pyecharts的说明很少,所以在这里将自己遇到的一些问题以及自己的一些见解整理出来,以下的一些说明与理解可能较为粗浅,万望各位读者见谅。
Geo:地理坐标系
Geo作为一个地理坐标标注的工具,在功能上新老版本基本是一致的,但在细节上却有着很大的差别,这也导致了新旧代码是完全不通用的。
在v0.5.X版本中在创建geo的过程中是可以对其进行一些基本参数设定的
如以说明文档中的例子:
geo = Geo("全国主要城市空气质量", "data from pm2.5", title_color="#fff", title_pos="center", width=1200, height=600, background_color="#404a59", ) ```
<p>可以设定主标题,副标题,标题颜色为止,图表大小,背景颜色等。</p>
<p>但在新版本中继续按照这样的格式进行创建时,编译器报错AttributeError: 'str' object has no attribute 'get',没有这样的对象。在新版文档中对Geo是直接进行创建的geo = Geo(),其实这样创建基本也就可以了,但是如果你真的想对其进行更多的参数设置,当然也是可以的。</p>
<p>在新的库中,对Geo的操作统一放在init_opts中,对其进行更改需要统一的对类opts.InitOpts进行修改,这里我们就需要引入from pyecharts import options as opts才能进行调用。</p>
<p>具体的InitOpts包括以下一些参数</p>
```python
class InitOpts(BasicOpts):
def __init__(
self,
width: str = "900px",
height: str = "500px",
chart_id: Optional[str] = None,
renderer: str = RenderType.CANVAS,
page_title: str = CurrentConfig.PAGE_TITLE,
theme: str = ThemeType.WHITE,
bg_color: Union[str, dict] = None,
js_host: str = "",
animation_opts: Union[AnimationOpts, dict] = AnimationOpts(),
):
self.opts: dict = {
"width": width,
"height": height,
"chart_id": chart_id,
"renderer": renderer,
"page_title": page_title,
"theme": theme,
"bg_color": bg_color,
"js_host": js_host,
"animationOpts": animation_opts,
}
需要注意的是对opt.InitOpts直接进行配置的话,只能对部分参数进行更改,如bg_color等,而width,height等参数是固定的无法修改的,比如如果这样设定
geo = Geo(init_opts = opts.InitOpts("aaa", width = 400, height = 200, bg_color = "#404a59"))```
<p>将报TypeError: init() got multiple values for argument 'width'多赋值的错误。好在新版本除了提供Opts 配置项作为参数传入,还提供了原生 dict 作为参数配置,所有参数均可以自己任意定义,具体操作代码是</p>
```python
geo = Geo(init_opts = {"width":1600,"chart_id":"ceshi","bg_color":"#404a59"})
这里发现了一个奇怪的现象,当更改height参数时,将直接导致地图标注无图像,至今未明白其中的原因。
add_schema是Geo下的一个函数,具体功能是对地图的参数与功能进行一些配置,主要包括有
def add_schema(
# 地图类型,具体参考 pyecharts.datasets.map_filenames.json 文件
maptype: str = "china",
# 是否开启鼠标缩放和平移漫游。
is_roam: bool = True,
# 当前视角的缩放比例。默认为 1
zoom: Optional[Numeric] = None,
# 当前视角的中心点,用经纬度表示。例如:center: [115.97, 29.71]
center: Optional[Sequence] = None,
# # 标签配置项,参考 `series_options.LabelOpts`
label_opts: Union[opts.LabelOpts, dict, None] = None,
# 地图区域的多边形 图形样式。
itemstyle_opts: Union[opts.ItemStyleOpts, dict, None] =None,
# 高亮状态下的多边形样式
emphasis_itemstyle_opts: Union[opts.ItemStyleOpts, dict,None] = None,
# 高亮状态下的标签样式。
emphasis_label_opts: Union[opts.LabelOpts, dict, None] =None,
):
这里我只使用过maptype,zoom,label_opts的设置,具体设置如下
geo.add_schema(maptype = "china", zoom = 1, label_opts = opts.LabelOpts(is_show=True))
maptype可替换成世界地图,省份地图等,地图资源可通过以下
pip install echarts-countries-pypkg
pip install echarts-china-provinces-pypkg
pip install echarts-china-cities-pypkg
pip install echarts-china-counties-pypkg
pip install echarts-china-misc-pypkg
zoom是缩放设置,label_opts是标签设置,如同1中的设置,这里也是可以通过原生dict进行自定义设置的。
Geo中可以自己增加需要标注的坐标点,通过设置地点,经度,纬度这三个参数即可完成添加。
def add_coordinate(
# 坐标地点名称
name: str,
# 经度
longitude: Numeric,
# 纬度
latitude: Numeric,
)
这个函数和旧版是一致的,应用也非常简单,此处不再多加赘述,举一个简单的例子
geo.add_coordinate("标注地点", 120, 80)
这是Geo中最主要的函数模块,可供设置的参数类型也比较多,新版的add函数结构与以前相比也有较大的改动,相关的参数如下所示
def add(
# 系列名称,用于 tooltip 的显示,legend 的图例筛选。
series_name: str,
# 数据项 (坐标点名称,坐标点值)
data_pair: Sequence,
# Geo 图类型,有 scatter, effectScatter, heatmap, lines 4 种,建议使用
# from pyecharts.globals import GeoType
# GeoType.GeoType.EFFECT_SCATTER,GeoType.HEATMAP,GeoType.LINES
type_: str = "scatter",
# 是否选中图例
is_selected: bool = True,
# 标记图形形状
symbol: Optional[str] = None,
# 标记的大小
symbol_size: Numeric = 12,
# 系列 label 颜色
color: Optional[str] = None,
# 是否是多段线,在画 lines 图情况下
is_polyline: bool = False,
# 是否启用大规模线图的优化,在数据图形特别多的时候(>=5k)可以开启
is_large: bool = False,
# 特效尾迹的长度。取从 0 到 1 的值,数值越大尾迹越长。默认值 0.2
trail_length: Numeric = 0.2,
# 开启绘制优化的阈值。
large_threshold: Numeric = 2000,
# 标签配置项,参考 `series_options.LabelOpts`
label_opts: Union[opts.LabelOpts, dict] = opts.LabelOpts(),
# 涟漪特效配置项,参考 `series_options.EffectOpts`
effect_opts: Union[opts.EffectOpts, dict] = opts.EffectOpts(),
# 线样式配置项,参考 `series_options.LineStyleOpts`
linestyle_opts: Union[opts.LineStyleOpts, dict] = opts.LineStyleOpts(),
# 提示框组件配置项,参考 `series_options.TooltipOpts`
tooltip_opts: Union[opts.TooltipOpts, dict, None] = None,
# 图元样式配置项,参考 `series_options.ItemStyleOpts`
itemstyle_opts: Union[opts.ItemStyleOpts, dict, None] = None,
)
其中,新旧版本最大的一个不同是,旧版的地点和值分开配置给attr和value,旧版的典型示例如下
from pyecharts import Geo
data = [
("海门", 9), ("鄂尔多斯", 12), ("招远", 12), ("舟山", 12), ("齐齐哈尔", 14), ("盐城", 15)
]
geo = Geo(
"全国主要城市空气质量",
"data from pm2.5",
title_color="#fff",
title_pos="center",
width=1200,
height=600,
background_color="#404a59",
)
attr, value = geo.cast(data)
geo.add("", attr, value, type="effectScatter", is_random=True, effect_scale=5)
geo.render()
而新版的add函数将地点和值放在了一个数据项里,
geo.add("", [attr, value], type_=ChartType.HEATMAP, symbol_size = 12, label_opts = opts.LabelOpts(is_show=False))
其他一些参数配置大致与以前是一致的,配置方式也可同样参照1中的方式进行。
在运行中发现一个有趣的问题,如一个个对坐标进行显示插入
geo.add_coordinate("测试点1", 20, 40)
geo.add("haha1", [("测试点1", 60)])
geo.add_coordinate("测试点2", 60, 80)
geo.add("haha2", [("测试点2", 60)])
这样运行是没有问题的,但如果对列表中的项进行批量的插入,如
for i in range(num):
geo.add_coordinate(address[i], lng[i], lat[i])
geo.add("", [(address[i],60)])
这样做是会报错的,具体原因不是太明白,无奈只能进行如下修改
for i in range(num):
geo.add_coordinate(address[i], lng[i], lat[i])
geo.add("", [(address[i],60) for i in range(num)])
做了这样的修改后就没有问题了,如果有知道原因的朋友可以留言给我,万分感谢
还有一个值得注意的问题是,对中国地图进行标注时,使用的地点不能包含“省”,“市”等,只能使用“江苏”,“浙江”等地名,不然就是无效的。
最后想放一张自己运行生成的标注地图,无奈第一次标记这边的文章,不会添加图片!!!
以上为个人经验,希望能给大家一个参考,也希望大家多多支持python博客。如有错误或未考虑完全的地方,望不吝赐教。