服务器

数据丢失并恢复

10 月 21 号的早上,得到消息说服务提供商由于遭到前雇员的破坏,导致几乎所有虚拟机的数据丢失,不幸的是,我们的服务器就在其中。只有 IP 地址没变。但是我自己没有做备份,所以还想着所有的数据都丢了,所有的都需要重新来过。不过我自己使用 [Bazaar] 控制所有的日志,这部分可以保存下来,但配置、评论、统计数据以及其他一些没有保存的页面就找不回来了。不过前一段时间比较忙,把重建的工作先放了下来。

今天准备开始的时候,得知大概五月份的备份还有,哈哈,高兴死了。那时候我们正好要转换服务器,所以做了一个整个磁盘的备份。现在正好从里面拿到以前的数据,然后在这个基础上稍微配置配置,再把丢失的几篇日志再贴上,现在基本上已经恢复到数据丢失前的状态,并重新规划了一下文件的存储方式,以更好的备份。需要备份的内容主要有以下几种:

  • Drupal 维护的所有内容,包括用户、文章、评论、统计数据、各种模块的配置等,保存在数据库中。
  • 各种静态的文件,包括 Drupal 站点的配置文件、用户上传的文件、提供下载的问题建等,保存在文件系统中。
  • Apache 虚拟站点的配置,其中包含了一些为了达到一些目标而弄的怪怪的配置。

更新 Drupal 的统计模块

为了能看到每篇文章或者日志有多少人人看过,需要开启 Drupal 的“统计”(Statistic)模块。以前用过一次,后来发现有几个问题:搜索引擎的搜索记录也算进去了,还有一个就是我自己的点击也算了进去,这样看起来节点的点击量都很多,实际上绝大部分都是搜索引擎带来的,看着也不爽。后来就关掉了。前两天又找了一下,找到了一个模块 [Statistics Advanced Settings],发现是完全符合我的需求,然后就装上试用。

这个模块提供的功能有三个:

  • 不会重复计数。对同一个 Session ID 的匿名用户或者同一个用户只计算一次。
  • 丢弃特定角色(Role)的用户的访问记录,比如管理员和作者自己。可以通过 “Administer => Reports => Access log settings” 来设定。
  • 丢弃爬虫和机器人的访问记录。这个功能需要和 [Browscap 模块]一起来使用。当 Browscap 安装设置好以后就直接可以看到效果了。具体请看下文。

诸多磨难

上次[服务器被黑]事件以后,pnt 好不容易把服务器给弄好了,可是差不多一个月前服务提供商的一个磁盘阵列出了问题,然后服务全都停掉了,数据也全部都丢了。前两天才弄好,这次可要吸取教训,一定要把数据和配置备份好。不过我这里没有条件做到自动备份,正在想怎么弄会比较好一点。不然的话就只好在服务器上弄个脚本,每次手动运行一下,然后打包。

Syndicate content