为什么要做 hold

February 17, 2015

01年上大学时, 就曾经梦想做一个自己的网站. 问题在于当时无论租用空间还是买域名都是一笔不菲的开销, 对于那时穷逼的我是无法承受的, 外加对技术的不自信, 就这么搁置下来了.

忙忙碌碌工作多年, 都是在给企业政府默默的做着内部系统. 某天自省时, 一个激灵, 跳起来立马将域名, vps 纳入囊中.

个人 blog / 自己做的创意小网站 / 协助工作的小程序 / 因为众所周知原因看世界的跳板工具 / 大 caoliu 的反向代理 / Dropbox 的后备站 一不小心就将各种各样的程序塞满了可怜的小小 vps

入手的是 DO 的5刀最低配置, 个人使用够了.

可是…可是…

“这个问题的解决方案我的 blog 上有记录!“我得意洋洋的和同事说道, 同事一脸鄙视的看着我:“可是你给的 blog 地址打不开哎” .尼玛, 果然 blog 早就挂了好几天了, 好吧, 我启动.

突然的 google 访问不了了, 正紧急查一个问题呢!!! 果然可爱的 shadow**** 不见了, 还是 server 端, 我还使劲重启客户端来着.

以上情况反复出现. 只不过受害者也一直在变 postgresql, dropbox

主要是很烦, 时不时给你来一下, 我快 hold 不住了.

你说升级 DO? 好吧, 你是豪, 慢走不送.

作为一个程序员, 我必须要彻底查明解决这个问题

你可以时不时的 ssh 上去 top 看一下, 可是每次去看都是乖乖的, 一不留神又出问题了, 再说了, 人生苦短, 哪有那么多时间登上去盯着 top

机器能做的事情, 就让机器做吧! 上监控吧!

搜一搜, 国外国内, 开源收费.从云端监控, 到自己搭建 server; 选择那是多到一塌糊涂.

开源的需要自己搭建 server 的就算了,我那个 vps 的资源还得省着自己用呢.

云端装 agent 的吧..哎,复杂的一塌糊涂啊, 又是 snmp 又是各种要弄

其实我的需求很简单

足够简单, 一条命令安装 agent

简单的监控我的 vps, cpu 内存 网络 磁盘空间 等等基础信息是必须的

重点是进程: * 资源被哪些进程瓜分了, 我来判别是哪个有问题.

  • 核心进程监控:我要指定我要关注的核心进程, 一旦进程消失了, 通知我! 各种深入代码级别的排查, 统统不要做.
  • 一个我不放心, 那么深入, 我岂不是赤裸裸的暴露了;
  • 另外一个, 程序没我聪明, 分析和问题排查还是我自己来好了, 这样的综合判断还是要人来做.

comments powered by Disqus