Nginx小节Nginx服务大方面的功能
- www web服务 http 80
- 负载均衡(方向代理 proxy)
- web cache(web缓存)
Nginx特点
- 配置简单,更灵活
- 高并发(静态小文件 1-2W)
- 占用资源少。2W并发 开10个进程服务,内存消耗几百兆
- 功能种类比较多(web、cache、proxy)每一个功能都不是特别强
- 支持 cpoll 模型,是的 Nginx 可以支持高并发!
- Nginx 配合动态服务和 apache 有区别
-
利用 Nginx 可以对 IP限速,可以限制连接数
nginx实现原理
nginx的应用场合
1.静态服务器(图片、视频、html、js、css、flv等)。常用的一个是nginx,另一个为 ligttpd。并发:1-3w
2.动态服务,nginx+fastcgi 的方式运行 php 、jsp。并发:500-1500,瓶颈在于 php 与 mysql 中。
3.反向倒立,负载均衡。日 PV2000W 以下,都可以直接用 nginx 做代理。haproxy、F5、a10
4.缓存服务。SQUID、VARNISH
web服务建议
静态业务:高并发,采用 nginx 或 lighttpd ,根据自己的掌握程度或公司的要求
动态业务:采用 nginx 和 apache 均可
×××动态业务又有静态业务:Nginx 或 Apache,不要多选,要单选
如果并发不是很大,有队 apache 很熟悉,采用 apache 也是可以的,apache2.4 版本也很强大,并发链接数也有所增加,见压力测试
思想:学习、工作都不要追求一步到位,满足需求的前提下,先用,然后逐步完善
提示:Nginx 做 web(apache、lighttpd)、反向代理(haproxy、lvs、nat)及缓存服务器(squid)也是非常不错的
最终建议:对外的业务 Nginx,对内的业务 Apache(yum httpd mysql-server,php)
ubuntu 16.04.1 下如何卸载 nginx
1.删除nginx,-purge包括配置文件
sudo apt-get --purge remove nginx
2.移除全部不使用的软件包
sudo apt-get autoremove
3.罗列出与nginx相关的软件并删除
dpkg --get-selections|grep nginx
4.查看nginx正在运行的进程,如果有就kill掉
ps -ef |grep nginx
kill -9 XXX
5.全局查找与nginx相关的文件并删除
find / -name nginx*
rm -rf file
Nginx 启动原理与模型
- Nginx 在启动后,在 unix 系统中会以 daemon 的方式在后台运行,后台进程包含一个 master 进程和多个 worker 进程。
- master 进程主要用来管理 worker 进程,包含:接收来自外界的信号,向各 worker 进程发送信号,监控 worker 进程的运行状态,当 worker 进程退出后(异常情况下),会自动重新启动新的 worker 进程。
- 多个 worker 进程之间是对等的,他们同等竞争来自客户端的请求,各进程互相之间是独立的。worker 进程的个数是可以设置的,一般我们会设置与机器cpu核数一致。
- kill -HUP pid,则是告诉 Nginx,从容地重启 Nginx,此服务是不中断。master 进程在接收到 HUP 信号后是怎么做的呢?首先 master 进程在接到信号后,会先重新加载配置文件,然后再启动新的 worker 进程,并向所有老的 worker 进程发送信号,告诉他们可以光荣退休了。新的 worker 在启动后,就开始接收新的请求,而老的 worker 在收到来自 master 的信号后,就不再接收新的请求,并且在当前进程中的所有未处理完的请求处理完成后,再退出。
- Nginx 在 0.8 版本之后,引入了一系列命令行参数,来方便我们管理。比如,./nginx -s reload,就是来重启 Nginx,./nginx -s stop,就是来停止 Nginx 的运行。如何做到的呢?我们还是拿 reload 来说,我们看到,执行命令时,我们是启动一个新的 Nginx 进程,而新的 Nginx 进程在解析到 reload 参数后,就知道我们的目的是控制 Nginx 来重新加载配置文件了,它会向 master 进程发送信号,然后接下来的动作,就和我们直接向 master 进程发送信号一样了。
- worker 进程又是如何处理请求的呢?前面有提到,worker 进程之间是平等的,每个进程,处理请求的机会也是一样的。当我们提供 80 端口的 http 服务时,一个连接请求过来,每个进程都有可能处理这个连接,怎么做到由一个worker来处理呢?首先,每个 worker 进程都是从 master 进程 fork 过来,在 master 进程里面,先建立好需要 listen 的 socket(listenfd)之后,然后再 fork 出多个 worker 进程。所有 worker 进程的 listenfd 会在新连接到来时变得可读,为保证只有一个进程处理该连接,所有 worker 进程在注册 listenfd 读事件前抢 accept_mutex,抢到互斥锁的那个进程注册 listenfd 读事件,在读事件里调用 accept 接受该连接。当一个 worker 进程在 accept 这个连接之后,就开始读取请求,解析请求,处理请求,产生数据后,再返回给客户端,最后才断开连接,这样一个完整的请求就是这样的了。我们可以看到,一个请求,完全由 worker 进程来处理,而且只在一个 worker 进程中处理。
- Nginx 采用这种进程模型有什么好处呢?当然,好处肯定会很多了。首先,对于每个 worker 进程来说,独立的进程,不需要加锁,所以省掉了锁带来的开销,同时在编程以及问题查找时,也会方便很多。其次,采用独立的进程,可以让互相之间不会影响,一个进程退出后,其它进程还在工作,服务不会中断,master 进程则很快启动新的 worker 进程。当然,worker 进程的异常退出,肯定是程序有 bug 了,异常退出,会导致当前 worker 上的所有请求失败,不过不会影响到所有请求,所以降低了风险。当然,好处还有很多,大家可以慢慢体会。
- Nginx 采用多 worker 的方式来处理请求,每个 worker 里面只有一个主线程,那能够处理的并发数很有限啊,多少个 worker 就能处理多少个并发,何来高并发呢?非也,这就是 Nginx 的高明之处,Nginx 采用了异步非阻塞的方式来处理请求,也就是说,Nginx 是可以同时处理成千上万个请求的。想想 apache 的常用工作方式(apache 也有异步非阻塞版本,但因其与自带某些模块冲突,所以不常用),每个请求会独占一个工作线程,当并发数上到几千时,就同时有几千的线程在处理请求了。这对操作系统来说,是个不小的挑战,线程带来的内存占用非常大,线程的上下文切换带来的 cpu 开销很大,自然性能就上不去了,而这些开销完全是没有意义的
- 为什么 Nginx 可以采用异步非阻塞的方式来处理呢,或者异步非阻塞到底是怎么回事呢?在 Nginx 里面,最忌讳阻塞的系统调用了。不要阻塞,那就非阻塞喽。非阻塞就是,事件没有准备好,马上返回 EAGAIN,告诉你,事件还没准备好呢,你慌什么,过会再来吧。好吧,你过一会,再来检查一下事件,直到事件准备好了为止,在这期间,你就可以先去做其它事情,然后再来看看事件好了没。虽然不阻塞了,但你得不时地过来检查一下事件的状态,你可以做更多的事情了,但带来的开销也是不小的。所以,才会有了异步非阻塞的事件处理机制,具体到系统调用就是像 select/poll/epoll/kqueue 这样的系统调用。它们提供了一种机制,让你可以同时监控多个事件,调用他们是阻塞的,但可以设置超时时间,在超时时间之内,如果有事件准备好了,就返回。
- 知道了 Nginx 为什么会选择这样的进程模型与事件模型了。对于一个基本的 Web 服务器来说,事件通常有三种类型,网络事件、信号、定时器。