――サーバ管理者の陣容は?
アプリケーションサービス部は、Web系のサービス(ストリーミングなどを含む)を扱う部署、メール系サービスを扱う部署、それ以外のサービスを扱う部署の3つの部署に分かれています。サポートや営業支援といった業務に就いている者を除くと、30名弱でサービス・ホストの運用を行っています。
――どのようなサーバ監視体制を敷いているのか?
SNMPを使った独自の監視システムを構築してあり、各サービス・ホストで稼働しているsnmpd(NET-SNMP)から情報を収集して、稼働状況を把握できるようになっています。最近導入するサーバはPCサーバとLinuxという組み合わせが多いのですが、SPARC/Solarisでしか動作しないようなアプリケーションもありますし、FreeBSDもたくさん使っているので、異機種混在環境になっています。独自のシステムを構築しているのは、OSやアーキテクチャに依存しない監視システムが必要だからです。
――SNMP経由で検知した障害にはどのように対処しているのか?
障害が発生した場合、ネットワーク経由でログインして制御できればよいのですが、OSのネットワーク機能がダウンしたり、OS自体が反応しなかったりする場合は強制的に電源を制御する必要があります。IIJではそうした電源制御をリモートから行うために、UNIXサーバはシリアルコンソールを設定しておくというポリシーがあります。ただし、PCサーバ、特にフロント系に使われる軽量サーバにはシリアルコンソール経由で電源制御できる機種がほとんどありませんでした。先ほど触れた特注サーバもリモートからの電源制御ができません。そのため、こうしたサーバでは手動での電源リセットをデータセンター側のスタッフに依頼しています。この場合、依頼してから実際にリセットされるまで30分くらいかかることもあります。
一方、「i110Rb-1h」に搭載されているBMC(Baseboard Management Controller)のEXPRESSSCOPEエンジンはIPMI 2.0に対応していて、Serial over LAN(シリアルコンソールと同等の制御をネットワーク経由で可能にする機能)が利用できます。現在導入済みの「i110Rb-1h」の半数くらいは、Serial over LANを使って電源制御できるようにしてあります(下図参照)。具体的には、ipmitoolとDHCPサーバをインストールした踏台ホストがあり、サービス・ホストはマネージメント・ポートを経由してDHCPでIPMIネットワークに接続されています。サービス・ホストの電源を制御する必要があるときは、いったん踏台ホストにログインして、ipmitoolコマンドで制御命令を発行します。
| 図:IPMIネットワークのイメージ |
|---|
|
| 各サービス・ホストはDHCPでIPMIネットワークに接続。踏台ホストからipmitoolを使うことで機器の電源オン/オフやSerial over LANを実施。 |
Serial over LANにはコスト面でのメリットもあります。シリアルコンソールを敷設する場合、中継器の費用も含めるとポート単価が1万円以上になります。サーバ自体が安くなっているとはいえ、台数が増えるとかなりコストがかかります。Serial over LANはそこそこのスイッチを用意すれば利用できるので、ポート単価はシリアルコンソールよりもずっと安価です。もちろん、サーバがSerial over LANに対応している必要はありますが。なお、IPMIではファンや温度、ディスクの状態といったハードウェア情報も収集できますが、IIJでは監視にはSNMPを使い、IPMIは専ら電源オン/オフなどの制御に使用しています。
現状ではデータセンター側に依頼しなければ電源制御のできないサーバもまだまだ残っていますが、徐々にリモートから電源制御ができるサーバに入れ替えていきたいと考えています。
――今後のiモデルへの要望を聞かせてほしい。
ハードディスクのホットスワップにはぜひ対応してほしいですね。すでに上位機種(Xeon搭載の「i110Rh-1」、「i120Rg-1」)は対応しているようですが、フロント系サーバとして1Uハーフサーバを重宝している立場から言わせてもらうと、そこまでの処理能力はいらないので、1Uハーフサーバが低消費電力のままでホットスワップに対応してくれるとありがたいですね。
|
IIJインフォメーションセンター
TEL:03-5205-4466
FAX:03-5205-4460
E-mail:info@iij.ad.jp
NEC 8番街
http://nec8.com/
iモデルの情報満載! 「NEC iモデル Wiki」
http://sourceforge.jp/projects/nec-imodel/wiki/
