nagios: 一款出色的网络数据监控报警工具 http://nagios.org
libfetion: 移动飞信的非官方lib http://www.libfetion.cn/
midpssh: 移动端的ssh客户端 http://www.xk72.com/midpssh/
当然以上三者的结合,就是要解决服务器问题最快发现,最快通知,最快解决的方案。
在没有搭建这个报警平台之前,每天都在担心中度过,对所有机器的健康状态基本没谱,现在轻松了很多,一些机器都很长时间没登录上去过问了。下面分享一下经验,供所有像我一样的穷网管借鉴,的确只是一条穷人的经验。
一.搭建nagios:
关于nagios的安装,可以上网搜索一大把,这里就不在详细介绍。基本上有两种安装方式:
1。 用apt-get安装现成的软件包。 哈哈简单吧
2. 源码安装,参考资料最好的是官方说明文档,详细的出你的意料
和cacti一样,nagios在安装的时候就存在一些基本的监控脚本供使用,如果需要一些其它监控脚本可以自己扩展,或者下载一些现成的扩展。呵呵,这个网站提供的扩展够你爽 。
基本配置文件路径:
/usr/local/nagios/etc/nagios.cfg
在nagios.cfg中把很多监控对象都的子配置文件都存放到了 /usr/local/nagios/etc/objects 目录中
nagios提供了监控信息的web与wap展示以及设置。也就是说大部分的工作都可以在web前台完成。
apache的部分配置:
# SSLRequireSSL
Options ExecCGI
AllowOverride None
Order allow,deny
Allow from all
# Order deny,allow
# Deny from all
# Allow from 127.0.0.1
AuthName "Nagios Access"
AuthType Basic
AuthUserFile /usr/local/nagios/etc/htpasswd.users
Require valid-user
Alias /nagios "/usr/local/nagios/share"
# SSLRequireSSL
Options None
AllowOverride None
Order allow,deny
Allow from all
# Order deny,allow
# Deny from all
# Allow from 127.0.0.1
AuthName "Nagios Access"
# SSLRequireSSL
Options ExecCGI
AllowOverride None
Order allow,deny
Allow from all
# Order deny,allow
# Deny from all
# Allow from 127.0.0.1
AuthName "Nagios Access"
AuthType Basic
AuthUserFile /usr/local/nagios/etc/htpasswd.users
Require valid-user
Alias /nagios "/usr/local/nagios/share"
# SSLRequireSSL
Options None
AllowOverride None
Order allow,deny
Allow from all
# Order deny,allow
# Deny from all
# Allow from 127.0.0.1
AuthName "Nagios Access"
AuthType Basic
AuthUserFile /usr/local/nagios/etc/htpasswd.users
Require valid-user
如果用你的是nginx服务器请查看这里
对于监控本机之外的机器nagios提供了主动执行监控插件和被动的接收监控数据两类,分别对应的 nrpe和nsca ,你可以根据 你的需求自己选择。两个插件很有用的,有时间多研究一下吧!!
nagios就说这些,更具体的说明请参阅官方文档
二,libfetion:
这是个好东西呀,这啥这么说呢!飞信可以给手机发短信通知。有了飞信的开发库,你就可以把nagios监控到信息通知到你手机上去,不用花钱去买什么短信网关。自己编译一个给nagios调用就行了,当然你不会编程没关系用现成的吧。在此感谢世上所有的乐于分享的人。依个人经验,在libfetion编译的时候可能会出现一些兼容性的问题,请大家大胆的把g++更新到最新的版本,再进行编译。
三,midpssh:
这个只是本人推荐的一个手机ssh客户端,在我的blackberry上运行不错,当然你如果有更好的ssh移动端工具,欢迎推荐。
本文不是123教程,只是提出的一个解决服务器报警的组合方案。欢迎分享你的观点

One Response
Stay in touch with the conversation, subscribe to the RSS feed for comments on this post.
Continuing the Discussion