現在位置: ホーム / みらくるブログ / 【12/3開催】OpenStack 最新情報セミナー登壇レポート/運用管理に関する3つの最新事例をご紹介

【12/3開催】OpenStack 最新情報セミナー登壇レポート/運用管理に関する3つの最新事例をご紹介

日本仮想化技術株式会社様主催の「OpenStack最新情報セミナー」に当社の社員が登壇しました。その内容を紹介します。

ミラクル・リナックス 松永です。

 

さて、先日(12月3日)に、日本仮想化技術株式会社様主催で「OpenStack最新情報セミナー」が開催されました。

その中の一枠で、弊社のロバート・リンが登壇しましたので、その内容をかいつまんでご紹介したいと思います。

 

 

弊社の講演内容は、「OpenStack運用管理最前線!」。

 

先日パリで開催された「OpenStack Paris Summit 2014」の中で話されていた運用管理にまつわる3つの事例と、TechTalkで弊社が発表した内容を紹介しました。

OpenStack最新情報セミナー1OpenStack最新情報セミナー2

 

 

「OpenStack Paris Summit 2014」運用管理に関する3つの最新事例

研究機関「CERN」の事例

まず、最初のOpenStackの事例は、研究機関のCERNです。

 

CERNでは、加速機を使った核衝突などの実験を行っていますが、それらの実験で出るデータは様々な研究機関で使用されるそうです。

 

ただ、データ量が膨大(約40TB/秒)で、それを解析・計算するために1000台以上のVMで並列処理を行っています。

 

問題は、1000台以上のVMを一斉起動すると、スケジューラとGlanceがボトルネックとなって起動時間が4時間近くも掛かってしまうということで、「起動時間の短縮」と「VMイメージの転送効率化」の2つの観点で高速化を行いました。

 

どうやら、計算アプリが頻繁に更新されるため、キャッシュ内のVMイメージもすぐに陳腐化するようで、起動だけでなくVMイメージの再取得時(転送時)も高速化する必要があったとのことです。

 

彼らが工夫した点は以下の通りでした。

 

①Glanceから都度VMイメージを取ってきて起動することをやめて、Novaのキャッシュにあらかじめ入れておいて、そこから起動するようにして高速化した。(起動時間の短縮)

 

②GlanceからVMイメージを再取得するときも、Apache+Squidキャッシュ経由に変更することで高速化したことと、転送時のサイズを減らすために圧縮・展開効率の良いgzip-6を採用した。(VMイメージの転送効率化)

 

Cisco + ケント大学の研究事例

 

次のOpenStack事例は、Cisco社 + ケント大学の研究事例です。

 

 

問題は、OpenStackクラウドの不適切な利用に伴って大量のリソースが消費されてしまうというこで、如何にして不正利用者を摘出するか?といったテーマでした。

 

採用した手段は、Ceilometerを使用して習得したデータを、データマイニングの手法を使って最適解を出し、不正利用者をつきとめようということでした。

 

ここでのポイントは、適切な使用時で負荷が高い時や低いときのデータ、不適切な使用時(Ddos攻撃や仮想通貨のマイニングなど)のデータをいくつものサンプルとしてCeilometerから取得。

 

そのデータをマイニングエンジンの様々なアルゴリズムに食わせて機械学習をさせることにより最適解を求め、不適切利用者の摘出精度をあげていったとのことです。

 

RackSpace社の事例

 

最後、3つ目の事例は、RackSpace社の運用事例です。

 

 

RackSpace社ではOpenStack運用にあたり、2つの問題がありました。

 

①障害が一つ発生すると、関連する膨大な数のアラートが発生して、どこから手をつけていいのかわからない。

 

②リソースの枯渇で突然サービスが停止することがあり、枯渇を事前に知る方法を確立する必要がある。

 

 

まず一つ目は、ある障害が発生したときに当然起こりえるアラートを関連付けて整理する(マップ)ことにより、根本原因となるものと無視して良いものに分けました。

 

例えば、DBのヘルスチェックでダウンしていた場合には、ログインできない、認証しようとしてもレコード参照できないといったエラーやアラートは当然発生するが、無視できるであろうという考え方をマッピングしたものです。

 

これにより、根本原因の特定をスムーズに行えることができるようになりました。

 

また、二つ目のリソース枯渇を事前に知る方法としては、測定対象のリソース使用量の推移を一定期間計測し、標準偏差などを使って変化率を求め、それをもとに「いつ頃閾値に到達するか?」を計算するという手法をとりました。

 

 

以上が、OpenStack サミットで聞いてきた3つの事例です。

「OpenStack Paris Summit 2014」 弊社が発表したTeckTalkの内容

 

OpenStack最新情報セミナー3次が、OpenStack SummitのTechTalkで弊社が発表した内容で、タイトルは「Hatohol を使ったSIPサービスのQoSソリューション」。

 

こ こでのポイントは、イベントやキャンペーン、チケット販売などで一時的に負荷が上がったSIPサービスのQoSをどう保つか?という課題に対し、まずは SIPサービスのVMを柔軟に加えたり外したりできるようにOpenStackを採用したということ。そして負荷が高くなった/低くなったといった閾値を Hatoholで監視し、OpenStackのAPIをキックすることで追加や削除を行えるようにしたことです。

 

その他、もちろんHatoholを知らない方もいらっしゃるので、その概要やアーキテクチャ、そして「OpenStackと連携することでマルチテナント監視が可能になること。」などをお話ししました。

 

当日の講演内容は以上です。

 

 

なお、当日の講演資料は以下にアップされていますので、ぜひご一読ください。

 

発表資料ダウンロードURL

 

http://virtualtech.jp/20141203-seminar/

 

 

また、当日の模様はUstreamでも生中継されていましたが、録画もアップされています。
興味がありましたら、ぜひご覧ください。
#お恥ずかしながら、実は少しだけ私もお話ししました。(^^ゞ

 

Ustreamでのセッション動画再生URL

 

(前半): http://www.ustream.tv/recorded/56071107
(後半): http://www.ustream.tv/recorded/56071553

 

 

さらに、Hatoholのことをもっと知りたいという方のために、以下の製品ページを用意していますので、ご覧いただけると幸いです。

 

Hatohol製品ページのURL

 

http://www.miraclelinux.com/product-service/hatohol