502,504在超时的场景下会比较像,经常有人不能区分它们。499产生的原因也常常会和504会有内在的关联,你都了解吗?本文不光复现它们,而且会循序渐进,在对比之中复现它们。
下面所有复现的场景,修改nginx或者php-fpm的配置后,记得要重新启动。
环境介绍
- 系统环境和软件环境为:Linux,Nginx,php-fpm
- nginx 配置
fastcgi_connect_timeout 5; # nginx连接fastcgi的超时时间 fastcgi_send_timeout 10; #nginx往fastcgi发送参数的超时时间 fastcgi_read_timeout 10; #nginx从fastcig获取数据的超时时间
- php-fpm配置
所有复现场景都是在nginx根目录下创建一个hello.php文件,然后通过访问http://127.0.0.1/hello.php 来查看http响应code,hello.php代码如下:; 一次请求的最长执行时间 request_terminate_timeout = 30s
<?php sleep(7); // 通过调整sleep秒数,来达成不同的复现 echo 'hello world'; ?>
499
499, Client Closed Request, 客户端主动断开连接。
是指一次http请求在客户端指定的时间内没有返回响应,此时,客户端会主动断开连接,此时表象为客户端无响应返回,而nginx的日志中会status code 为499。
此状态码在浏览器请求时几乎不可见,因为浏览器默认的超时时间会很长。多见于服务之间的调用,在业务架构中常常会分层设计,拆分为不同的子系统或者微服务,这样系统之间就会常常通过http方式来请求,并且会设置每次请求的超时时间,当请求在请求时间内所调用的上游服务无返回,则会主动关闭连接,上游服务日志中会记录一条499。
- 复现路径
- php-fpm.conf
request_terminate_timeout=30
- nginx
fastcgi_read_timeout 5;
- php
我们在linux终端使用curl命令来请求,-m 表示超时时间,单位为秒<?php sleep(7); echo 'hello world'; error_log("hello", 3, "/tmp/hello.log"); ?>
curl -i -m 3 http://127.0.0.1/hello.php
返回:
curl: (28) Operation timed out after 3004 milliseconds with 0 bytes received
nginx的access日志的code为499,如下:
"HEAD /hello.php HTTP/1.1" 499 0
- php-fpm.conf
500
500, Internal Server Error , 服务器内部错误,服务器遇到了一个未曾预料的状况,导致了它无法完成对请求的处理。
日常开发中500错误几乎都是由于php脚本语法出现错误导致php-fpm无法正常执行。
-
复现路径
- php
<?php echo 'hello world' ?>
由于php代码语法错误,php-fpm执行失败,然后告诉nginx这一结果,nginx则返回500。
php错误日志:
PHP Parse error: syntax error, unexpected 'echo' (T_ECHO), expecting ',' or ';' in hello.php on line 2
502
502,Bad Gateway,网关错误,它往往表示网关从上游服务器中接收到的响应是无效的。
先来了解一下网关是什么含义,从宏观定义上来说只要连接两个不同的网络的设备都可以叫网关,其实具体到应用层Http请求这一领域,网关就是指是转发其他服务器通信数据的服务器,对于本文的复现环境而言,当客户端请求数据到达nginx,nginx负责把请求转交给fastcgi(即php-fpm)进行处理,那么在这个场景中Nginx就是网关。
502并不是指网关本身出了问题,而是从上游接收响应出了问题,比如由于上游服务自身超时导致不能产生响应数据,或者上游不按照协议约定来返回数据导致网关不能正常解析。
-
复现路径1
关闭php-fpm进程,返回502。
这个比较容易理解,参照上面的定义,因为php-fpm进程关闭,nginx连接不上php-fpm,即nginx不能收从上层接收到响应数据。nginx 错误日志如下:
connect() to unix:/tmp/php-cgi.sock failed (2: No such file or directory) while connecting to upstream
-
复现路径2
启动php-fpm进程,修改php-fpm.conf的request_terminate_timeout和php代码的sleep时间来复现。php
<?php sleep(7); echo 'hello world'; ?>
php-fpm.conf
request_terminate_timeout=5
nginx
fastcgi_read_timeout 10;
php-fpm.conf设置的最大执行时间是5s,但是php脚本需要的执行时间大于7s,所以php-fpm进程执行5s时就回退出,此时php脚本没有正常执行完成,所以返回给网关Nginx的数据异常,于是导致502。php-fpm错误日志如下:
script '/webroot/hello.php' (request: "GET /hello.php") execution timed out (5.161544 sec), terminating
nginx错误日志
recv() failed (104: Connection reset by peer) while reading response header from upstream
504
504,Gateway Timeout,网关超时。
它表示网关没有从上游及时获取响应数据。注意它和502在超时场景下的区别,502是指上游php-fpm因为超过自身允许的执行时间而不能正常生成响应数据,而504是指在php-fpm还未执行完成的某一时刻,由于超过了nginx自身的超时时间,nginx则以为上游php-fpm没有按照设置时间返回响应数据就会返回504, 此时对于php-fpm而言还会继续执行下去,直到执行完成。
-
复现路径
php<?php sleep(7); echo 'hello world'; error_log("hello", 3, "/tmp/hello.log"); ?>
php-fpm.conf
request_terminate_timeout=30
nginx
fastcgi_read_timeout 5;
hello.php脚本执行时间需要7s,远小于php-fpm的一次请求的最大请求时间30s,所以php脚本可以正常完成执行,这个可以查看/tmp/hello.log文件内容来得到证明。由于nginx从php-fpm读取数据的超时时间为5s,所以在5s的时科,nginx还未从php-fpm获取到响应数据,于是返回504。
nginx错误日志
upstream timed out (110: Connection timed out) while reading response header from upstream
总结
499是由于超过客户端设置的请求超时时间,客户端主动关闭连接,服务器code为499。
500多是由于代码语法错误,导致CGI执行错误并且会把错误结果通知服务器,服务器则报500。
502是由于CGI由于在自身的执行时间要求内无法按时完成,则无法返回给服务器正常响应,此时服务器会返回502。
504是CGI在服务器设置的超时时间内无法按时返回响应,服务器则返回504。
499,502,504都会因为超时而产生,区别是超时超了谁的时,499是超了客户端本身的连接时间,502是超了CGI的执行时间,504是超了服务器本身的最大允许读取时间。