这周对于我来讲,就是各种不顺。
第一件事就是邮件组加限制,创建了一堆大的邮件组,任何人都能给这个组发邮件。以前我跟HR说过,这种会有风险,如果有哪个人给这些大组发一些不良信息,影响太大,需要加限制。没有人听我的,结果几年后的某一天就出事了,反正就是发了一个信息,然后就是疯了一样找IT,要删除那个邮件。我知道怎么删除,但是没有权限,做不了。反正最后是消除影响了。第二天,我把就那些邮件组做了限制,只有许可的人才能群发邮件。好多公司都没有做这种限制,如果有看到的,自已回去抓紧做起来。这算丢了一只羊。
第二件事,就是我对一台文件服务器做导出的一个操作,提示我空间不足,然后再开文件服务器发现无法启动了,那个系统是Windows Server 2012R2,做的这个虚机居然磁盘用的是差异磁盘,这个肯定不是我做的。我最讨厌用这个方式做虚机。然后查了一下备份,太幸运了,DPM对这个服务器备份失败了,也不知道哪个大哥还把以前创建的备份给清除了。我得我还用DFS的Replication对这台机器做过备份,托老天的福,这个也挂了。the difference virtual hard disk chain is broken: please reconnect teh child to the correct parent virtual hard disk
我的另外一个备份系统,Rubrick呵呵,因为存储空间有限,我就没有备这台文件服务器。
然后吓得我马上把另外一个工厂的文件服务器用Rubrick给备份上了,有问题的服务器找总部IT想想办法,只不过是配置上的一个问题,应该有工具给修复了。这也算死了另一只羊。
用这种差分磁盘肯定是原来的那个IT做的,那个小伙子就爱倒腾,有标准的规范也不遵守,我都没有注意那台虚机是那样做的。
第三件事,一台R440服务器,就这台过保了,正在谈续保的事,公司的流程太长,每次买了维保都得是每年的五六月份,正说要用这台机器呢,本周突然就反复重启,查了一下日志,是主板电压过高引起的,查过相关报错,说升级一个固件就能解决,然而并没有解决。因为过保了,也没法报修,只能是等走流程,平时一提花钱就不乐意,这次就尴尬到这种情况了。
这一周丢了三只羊,其实架构运维有很多不确定性,总结经验就是:当资源不足时,要解决资源问题,因为存储空间不够,我也没有能力去备份重要的系统,没有办法,一提就是没有钱,这钱省来省去,最后就是一个大的问题。管理层不重视,管运维的不懂,这才是问题发生的根本。
架构的操作一定要规范,要有交接,前人挖的坑,后来人很难知道。另外,有很多不确定的因素存在,只能是见招拆招。