AWS

SIOS Coatiによる監視・復旧とは?

SIOS Coati開発チームの沼野井です。梅雨に入って鬱陶しい天気が続きますね! と書こうと思ったけどそうでもないので困りました…

さて、前回は宣伝に終始しましたが、今回は、

Coatiは何を監視・復旧するの?

ということで、Coatiによる監視・復旧について技術的なところを説明しようと思います。

Coatiは、

AWSのEC2インスタンス上で動作するアプリケーションを監視し、障害発生時に復旧させるサービス

です。大事なことなので前回に続いて2回言いました!

でも、AWSのEC2インスタンス上で動作するアプリケーションとか言ってるけど具体的には何ぞ..?

それは、

以下の一般的なプロセス管理ツールで管理されているサービス(デーモン)

監視対象インスタンスのOS ツール
CentOS 6/Redhat Enterprise Linux 6 SysVinit
CentOS 7/Redhat Enterprise Linux 7 systemd
Windows Server 2012 R2 サービスコントロールマネージャ

です。実に一般的ですね。

Coatiは最初に監視対象のインスタンスをサーチして、条件にマッチしたサービスを監視対象として登録します。
その条件は、こんな感じです。

監視対象インスタンスのOS 条件
CentOS 6/Redhat Enterprise Linux 6 chkconfigコマンドで自動起動に設定されている
service statusコマンドをサポートしている
CentOS 7/Redhat Enterprise Linux 7 systemctl is-activeコマンドで、稼動状態(active)または停止状態(failed)になっている
Windows Server 2012 R2 自動起動設定(スタートアップの種類が「自動(automatic)」)になっている
注意: 「自動(トリガー開始)(automatic(triggerd start))」のものは監視対象になりませんのでご注意下さい!

 

Coatiによる監視・復旧とは?

監視・復旧に使用するコマンドを、各OS毎に具体的に見ていきましょう。

  • Redhat Enterprise Linux 6/CentOS 6
動作 コマンド
監視(サービスが正常に動作しているかの確認) service status
復旧(サービスが正常に動作していない場合の再起動) service restart
  • Redhat Enterprise Linux 7/CentOS 7
動作 コマンド
監視(サービスが正常に動作しているかの確認) systemctl is-active
復旧(サービスが正常に動作していない場合の再起動) systemctl restart
  • Windows Server 2012 R2
動作 コマンド(Powershellコマンドレット)
監視(サービスが正常に動作しているかの確認) Get-Service
復旧(サービスが正常に動作していない場合の再起動) Start-Service

普通ですね。
でも、だからこそ色々なサービスが監視できる、と都合よく言い換えることができるのではないでしょうか!


いかがでしたか? 少しCoatiのことがお分かり頂けたなら嬉しいです。

現在、Coatiを無料10,000時間お試しすることができますので、是非、お試しください!

SIOS Coatiのご紹介!

こんにちは、SIOS Coati開発チームの沼野井です。
今後このブログで、開発者チームがローテーションでSIOS Coatiのサービスや使用している技術、開発秘話などを紹介していきたいと思いますので、よろしくお願いします。

今回は、SIOS Coatiとは何なのか? を紹介いたします。

SIOS Coatiとは何なのか?

SIOS Coatiは、

AWSのEC2インスタンス上で動作するアプリケーションを監視し、障害発生時に復旧させるサービス

です。

皆様がLinuxやWindowsサーバ上で運用しているシステムやアプリケーションのサービスの動作を定期的に監視し、障害でダウンしていた場合、自動的に復旧します。

 

SIOS Coatiを使うと何が嬉しいのか?

言うまでもなく、業務システムやサービスはダウンタイムが短いことが大事。
そのために、運用の中の人は、障害が発生したら

  • 深夜に起こされたり、
  • 週末に飲んでる途中に会社に戻ってこいと言われたりして、

徹夜で復旧作業する・・ようなケースもままあるのではないかと思います。
かく言う私も・・ああ過去のトラウマが

SIOS Coatiなら、サービスの動作を定期的に監視し…

障害が発生してれば、自動的に復旧します!

つまり障害が発生しても、

  • 朝まで寝てられます。むしろ二度寝してください!
  • 朝まで飲んでられます。但し、それに伴い発生するご家庭内の問題はSIOS Coatiの復旧対象外です

つまり、SIOS Coatiはシステム運用界の ALSO◯(あるいはセ◯ム)!
ぜひ導入をご検討下さい!

 


開発者のくせに宣伝100%になりましたが、初回ということでご容赦下さい。
では、次回以降もよろしくお願いします。

 

 

【SIOS Coati導入事例】インフォバーン様

勝手にサービスが復旧してくれる:
インフォバーンの情シスがAWSの監視を気にせず安眠できるようになった理由

Webサーバを安定運用するには監視が必要だが、監視ツールを利用した場合、通知はされるがその後の対応は運営側がやる必要がある。通知で深夜にたたき起こされ、業務に当たった経験のあるインフラエンジニアは多いはずだ。ところが、インフォバーンの情シス担当は、そんなことは気にせず安眠を手に入れたという。その秘訣を聞いた。

 

【落ちて初めて気付く自社サーバ運用体制】

自社の製品や関連技術に関する情報共有などを目的に、オウンドメディアやブログを独自に立ち上げる企業は増えている。その一方で、Webサーバを安定運用するには監視が必要だが、外部のマネージドサービスプロバイダー(MSP)に委託すればコストは想定以上にかさんでしまう。だからといってZabbixやNagiosなどのシステム監視ツールを利用した場合、通知はされるがその後の対応は運営側がやる必要がある。これはMSPに委託した場合も同様だ。通知で深夜にたたき起こされ、業務に当たった経験のあるインフラエンジニアは多いはずだ。

インフォバーングループ本社でインフラ管理を任せられている情報システム室の天野優氏も、そんな1人だ。

インフォバーンは、UX戦略、オウンドメディアの構築・運営を含むデジタルブランディング全般を支援するデジタルエージェンシーだ。天野氏が所属するインフォバーングループ本社の事業子会社である。インフォバーングループ本社の情報システム室では、インフォバーンにおける顧客のオウンドメディア用サーバの設計構築と運用管理、同じインフォバーングループ本社の事業子会社であるメディアジーン(「ギズモード・ジャパン」「カフェグローブ」「ライフハッカー[日本版]」「BUSINESS INSIDER JAPAN」「ROOMIE」などのコンテンツメディアを運営)のサーバのテクニカルサポート、社内サーバの設計構築と運用管理を行っている。

 

インフォバーングループ本社 情報システム室 天野優氏

 情報システム室には現在、天野氏を含む数名が在籍する。しかし、主に社内向けITサポートや「G Suite」などのクラウド型グループウェアの運用を担当するメンバーが多く、サーバの運用監視は天野氏をはじめとした少数メンバーで運用を行ってきた。

顧客サーバや自社メディアのサーバの約8割はAmazon Web Services(AWS)を採用し、CMS(Contents Management System)などを実装して運用、監視をMSPに委託していた。顧客案件ではプロジェクト予算の中から監視の外部委託費用を確保できること、自社メディアではサイトを落とすと機会損失に直接つながるスポンサードコンテンツや(スマートニュースなど)外部サービスからの記事紹介による計画的なアクセス流入を逃さないことから予算が付いている。

だが社内サーバについては「当時の監視は十分ではない面がありました。監視をMSPに丸投げしていたため“監視する”という意識が低く、Webサーバの冗長化や予防検知能力が高いとはいえない状況でした」。天野氏は3年前の入社当時を振り返りながらそう明かす。

【監視ツールやMSPだけではインフラエンジニアの安眠は確保できない】

問題は、通常業務の大半が顧客案件や自社メディア案件に割かれ、社内サーバの運用がおろそかになりがちという点だ。そこで入社して早々、天野氏はZabbixやNagiosなどのオープンソースソフトウェアの監視ツールを導入し、監視体制を構築した。しかし、24時間365日対応できるわけでもなく、既存メンバーのインフラ運用関連のナレッジ強化もすぐには実現しない。人材募集をかけてもマッチする人材となかなか出会えない。

そこで、Active DirectoryサーバやファイルサーバなどをAWSに全面移行。拠点間VPNで結びながらサーバの冗長化を実施、物理環境の運用管理の負担軽減を進めた。監視などは天野氏が対応する体制に切り替えた。

それでも、障害通知は昼夜問わず舞い込む。そのたびに天野氏は起きて復旧作業に取り掛からなければならない。サイオステクノロジー 第1事業部 BC事業企画部 担当部長の吉岡大介氏は多くの企業が直面する課題の背景を次のように分析する。

「パブリッククラウドは、構成変更やインスタンス増加の際に運用監視ツールの設定変更などの管理を利用者が行わなければならない上に、障害発生時やパフォーマンス低下などの通知に昼夜問わず利用者が対応しなければならないため、システム管理負担の増加が課題となってきている。監視ツールは障害通知を送信するだけで、MSPの監視委託でも復旧までに運用側のマニュアル対応が発生する。AWSの運用はシンプルでスケーラブルだが、監視のノウハウやスキル、リソースもそれに従って上がるが、見落とされがちだ」

 

 

 

サイオステクノロジー 第1事業部 BC事業企画部 担当部長 吉岡大介氏

 そんな中で天野氏が出会ったのが、サイオステクノロジーの「SIOS Coati」だ。同社とはG Suiteの販売サポートなどですでに付き合いがあり、事情を明かしたらベータ版が紹介された。

「サービスを落とすなど検証を繰り返し、想定通りに起動することが確認でき、信頼できると判断した。また、最初の簡単な設定で自動監視と復旧が実現できることも分かった」(天野氏)

 

SIOS Coatiの監視と復旧手順の例

コスト面も、初月は1万時間まで無料で利用や試すことができ、利用料金はインスタンス当たり1時間3円(税別)の従量課金で、満足できる価格帯だったという。

「サーバ監視は、顧客案件ならともかく内部なら外注ではなく情報システム部門が自前でやるべきという感覚がどうしてもある。だが、たとえそれで当面は対応できても、事業拡大に伴いいずれ破綻するときが来てしまう。そこで外部委託が決まっても、相場は月額15万円以上とそれなりにかかってしまう」(天野氏)

監視は運用工数がかかる業務だが見落とされがちで、外部委託時に価格を提示されて初めて気付くのが一般的だ。SIOS Coatiを採用することで、運用工数およびコストを抑えられるのは間違いない。

【設定は15分、障害発生を忘れるほどスムーズな復旧】

SIOS Coatiは、AWS EC2の監視、復旧を自動化でサポートするクラウドサービスだ。Amazon VPCとサイオスのAmazon VPCをピアリングし、AWSのAPI経由で監視、障害を迅速に検知して復旧する。ほぼリアルタイムで監視しているのと、スケールアウトにも対応しているので、インスタンスの増加があっても監視漏れが起こることはない。障害時には、詳細な障害レポートをメールで配信するので、障害分析の手間も減る。

SIOS Coatiによる社内サーバの監視を開始したのは、2017年3月初旬だ。「ピアリングの設定情報をWeb申し込み時に提出したら、あとは監視対象サーバを設定するだけ。WindowsとLinuxの設定手順書が用意されており、それに従ってクリックしていたら設定が終わった。正味10~15分程度だった」(天野氏)

SIOS Coatiの導入の例

復旧は自動で行われ、サービス再起動に失敗した場合は仮想マシンのOSを再起動する。その後、リカバリー前後に取得した仮想マシン、サービス、AWSの関連情報を基に障害発生からリカバリー成功までを障害レポートとして発行する。

運用開始後、まだ日が浅いから障害は発生していないと述べながら、「そういえば誤って他の情報システムメンバーがADサーバを落としてしまったときがあったが、外出時にメール通知が届き、見たらサービス復旧完了の知らせだった。質問を受けるまで忘れるくらい復旧がスムーズに行われていた」と天野氏は笑う。

基本的には勝手にサービスが復旧してくれるため、精神的にとても楽になったと天野氏は言う。「夜な夜な上がってくる障害通知に起こされ、慌てて対応することがなくなった。自社サーバとはいえ、障害から復旧、正常稼働までのプロセスが自動化、簡略化されたことがうれしい。もう安眠を妨害されることはない」(天野氏)

【WordPressやMastodonの監視運用など、幅広い活用が可能なSIOS Coati】

現在は一部の社内サーバで採用しているが、今後はAWS上の情報システム室関連のサーバ全てをSIOS Coatiで監視したいと天野氏は述べる。

また、将来的には顧客案件でも採用したいと明かす。

「メディアサイトの立ち上げ案件で、十分な予算が確保できないが冗長化構成をミニマムでもいいので導入したいというのもある。解決策としホスティングサービスを利用することも考えられるが、内容によっては割高になることもある。このときSIOS Coatiがあれば、AWSでサーバ1台に必要なWordPressやMovable TypeのようなCMSを実装し、落ちても自動復旧できるという付加価値を提供できる」(天野氏)

その意味で、より幅広い使い方ができるよう、今後のSIOS CoatiではWebサーバの関連性などプロセスを見ながらの自動立ち上げや、仮想マシンの自動立ち上げなどで機能拡充してほしいと期待を込める。機能の発展性が見込めるからこその要望だ。

「まだ提供開始して日の浅いサービスだが、クラウドサービスだからこそ、カスタマーファーストでこうしたフィードバックを直接もらい、どんどん機能を充実させていきたい」と応える吉岡氏は、インフラエンジニアでなくても使えるようなGUIの充実、社内の障害レポートに置き換えられるような障害レポートのブラッシュアップ、APIの提供による他監視システムとの連携などを検討したいと話す。「顧客の予算に応じて提供するものを考えるのではなく、コストを抑えながらも自動化で付加価値を提供することが大切であり、そこも含めてサポートできるサービスにしたい」

いま話題のMastodonサーバも、SIOS Coatiで安定運用が実現する。当初はサービスの安定性がサーバ運用者の手腕や労力に依存し、使えないという印象もぬぐえなかったMastodonだが、自前ソーシャルを立てる企業は増えている。SIOS Coatiは、こうしたサーバ運用の工数や不安を確実に軽減する。

無料の試用申し込みは、Webフォームからできる。まずはどれだけ障害を意識しなくて済むようになるか、実感してみてはいかがだろうか。

AWS Summit Tokyo 2017に出展しました

皆様、こんにちは、SIOS Coatiのマーケティング担当をしております吉岡です。

5/31-6/2に開催されましたアマゾンウェブサービスジャパン社が主催する世界最大規模の無料クラウドカンファレンス「AWS Summit Tokyo」へ出展しました。

 

 

今回はSIOS Coatiとしては初めてのイベントで皆様に知っていただくいい機会となり、様々な方々にブースにお越しいただきました。

 

正直「着ぐるみがいるブースがあるけどなんだ?」「サイオスなんか新しいことやり始めたの?」といった様々な反響が多く、「ところで何のサービス?」という風にいう方々も多くいて、コーティーに興味を持ってもらいつつ、サービスのSIOS Coatiについても知っていただけたいい機会となりました。

 

また様々なブースにもお邪魔させていただき、交流を持たさせていただいたことも大変よかったです!

 

今回様々なサービスへのご意見やご要望もいただく良い機会となり、ブースに起こしたいただいた方々には御礼申し上げます。

 

 

 

SIOS Coati Blogはじめました。

皆様、こんにちは、SIOS Coatiのマーケティング担当をしております吉岡です。

この度SIOS CoatiのBlogを始めました。

こちらのBlogではSIOS Coatiのサービスの機能についての紹介、使い方や利用事例の紹介、セミナー、イベントの出展情報などCoatiに関連する情報を提供していきます。

また、AWSを中心としたパブリッククラウドを利用する場合の運用に関する情報も提供していく予定です。

よろしくお願いいたします。