PostgreSQL 是一种先进的SQL数据库服务软件,可在大量的平台上运行(比如我们身边数据量非常之大的银行一账通系统、商城系统),且是一款支持大量平台的高级SQL数据服务软件。PostgreSQL最大的优势是完全开源,允许免费使用修改,甚至任何方式发布,也就是不需要向任何人付任何费用或版税。因此PG已经被很多的应该程序包所使用,许多Linux发行版已经把PostgreSQL作为它的基础安装,或者包含在了安装盘中。
那么PostgreSQL优势又有哪些?
稳定性强,SQL标准支持较好
支持PL/pgSQL等多种过程语言
支持视图、分析函数、CTE等高级特性
OLAP性能超过MySQL
占用空间小,vacuum方便整理无用的历史数据
高并发读写,负载下,PG性能指标较MySQL稳定
基于函数、条件以及cost的SQL优化,易于调优
已有访问Mysql、Redis、文本等外部数据源插件
支持快照增量备份,支持快速rollback
执行计划共享
获取PostgreSQL
下载源码或用于各种操作系统的二进制包:https://www.postgresql.org/download/
网上针对不同环境下如何安装PG数据都有详细的教程,这里提供几个链接供参考:
Linux:http://www.cnblogs.com/qiyebao/p/4562557.html
MacOS:http://www.cnblogs.com/shineqiujuan/p/4703304.html
Windows:http://blog.chinaunix.net/uid-354915-id-3498734.html
目前远程连接PostgreSQL图形化工具已有一系列可选工具,下面两款是最流行的:
pgAdmin3
phpPgAdmin
以下简单介绍pgAdmin3客户端应用程序,其工作原理是用来发送SQL到PostgreSQL,并快速和简单地显示结果。以1.22.1版本为栗
当首次启东pgAdmin时,会提示注册服务,如下图,填写完成服务器信息后点击【确定】即可登录pgAdmin主界面。
其命令与ORACLE基本相似,以下列举几个常用的。
pgAdmin还有一个优势就是自带查看执行计划工具,那么如何快速查看PostgreSQL的执行计划?
进入pgAdmin中,点击工具栏按钮进入sql窗口,如图
输入查询语句,
select tablename from pg_tables;
快捷键F7即可看到语句的执行计划。
下面简单介绍一下执行计划结果各字段含义:
1、 Cost
cost是比较重要的指标,比如第二个例子中的cost=0.42..8.44有两个部分,启动时间(startup)=0.42ms 和总时间(total)=8.44ms。其中启东时间是执行到返回第一行时需要的cost值,且都是预测值。
2、 Rows
预测的行数。与实际的行数可能有出入,经常vacuum或者analyze的话,这个值和实际值将更加接近。
3、 Width
查询结果的所有字段的总宽度。这个参数并不是关键指标。
与执行计划相关的几个参数:
代价因子relpages为磁盘页,reltuples是行数,一般比与实际值略小,因为relpages,reltuples数据不是实时更新的,一般在vacuum analyze和少部分DDL(如建立索引)后更新。
例如:suborder_info行数实际为798079,但查询的reltuples结果却为792691
一个普通的查询所有记录的语句,具体执行的时候,首先要读取磁盘页面,然后是把每一条记录取出来。没有索引、排序、分组、循环等多余的运算,所以其计划类型为Seq Scan,代价计算公式为:
relpages * seq_page_cost + reltuples * cpu_tuple_cost =16472*1+792691*0.01=24398.91
因为relpages,reltuples数据不是实时更新的,导致计算结果存在一定的差异。但在分析是否有调优空间时,这点差距并不影响我们的判断结果。
Explain Analyze可查看实际执行时候的执行计划,
#Explain Analyze select * from suborder_info where sub_order_no=’20170616013062821’;
loops:循环的次数。
Planning time:计划时间
Execution time:执行时间
查看执行计划,一般我们会关注消耗值cost和扫描的方式,如走索引或者full scan全表扫描。当COST值消耗比较大时需要注意是否有优化的可能,并进一步调试。
另附explain命令可带参数:
-analyze:执行命令并显示执行事件,默认false
-verbose:对执行计划提供额外的信息,如查询字段信息等,默认false
-costs:显示执行计划的,默认true
-buffers:默认false,前置条件是analyze
-format:默认格式是text