クラウドインフラ構築記

現在AWSの構築支援に携わっております。今注視しているのは、GKE、BigQuery、Google Dataflowなどサービスを展開しているGoolge Cloud Platformです。

HPC on AWSクラウドシリーズ 第三回:メーカー企業におけるビックデータ活用


12/11 HPC on クラウドのセミナーに参加してきました。

HPC on クラウドを実現するビックデータ処理のご紹介

 

在庫管理、物流などをITで
さまざまなシステムが有機的につながっている
ITのリソースの用意 時間がかかっていた
購入、セットアップ
社内で稟議などで決めていた。無駄
必要名ときにプチとして使えないか
クラウドの原型

発電機をもつのが差別化要因では
電気を使って何を作っていくのが

大きなパラダイム
必要なときに使う。より速く、簡単に、安くを実現

今まで出来なかったことができるようになる
改善、イノベーションも

2006/3/14 Amazon S3発表

去年は280
今年は、500を超える位の新機能の追加

EC2使用率 年率99%の成長率

いろんなIOS9001等の認証を取得

StartClusterをOnc-Commandで作成管理する (http://utility onnpass.com/event/9512/)

HPCの構成

  • ヘッドノード
  • 計算ノード
  • ストレージノード lustre OrangeFS
  • WANの高速化ソリューション skeed , aspera

 

c3.8xlarge 1,656ノード
484.2 TFLOPS
TOP5000 64位 NOV 2013
一時間当たり約29万円

実行性能が上がってきている。Efficiency
レイテンシーで性能変わっている。レイテンシが短くなっている

AWS専用に強化されたCPUを搭載したC4インスタンス発表

空く具合で定価の1/10で利用可能

現行だと1.8倍速くなっています。 c3 > cr1

オンプレよりもC3の方が速い

GPUインスタンス
Hour単位で
グラフィックスで使えるのかお試しでも
G2 + XenApp
クラウド上のGPUで

HPCの紹介

  • CieSpace
    AWSでSaaS
  • OpenFormで計算
    流体形跡
  • PLEXUS CAE
    ブラウザだけで計算
  • NEC HPC Online
    計算リソース
  • VT-HCM2
    VisualTechnology

HPCクラウドを支えるインテルの技術

 

ビジネスを効率化するツールからビジネスそのものになってきている
コンシューマーから発信してくるデータが増えてきている
IoT、センサーからのデータ
街角のカメラ
工場の中のデータ
増えてきている

膨大なデータの処理
パラレルデータベース、サーチ
莫大なデータを扱うアプリケーション
HPCへのニーズも

研修所だけでなくてもハイパフォーマンスコンピューティングのニーズも

Xeon がHPCの核

集積回路 トランジスタのサイズが小さく
今後も
小さくなるメリット 実装面積も増やせるし、消費電力の削減、物理的な距離も短く

E5-2600 v3
18個のコア
電力管理の工夫
メモリ DDR4
新しいフューチャーも
浮動小数点の演算も進化
ベクトル演算ユニット
浮動小数点 356bit幅
FMA( Fused Multiply-Add) 乗算と演算を同時に
90% Linpack
120% SPECjbb 2013-M

暗号化処理の向上も

消費電力も上げっていない

E5 2666 v3
AWS専用

本田技研工業におけるHPC on AWSの歩み

re:invent 2014のリピートセッションになります。

[slideshare id=41528400&doc=bdt201-141113144712-conversion-gate02]

Local、スピード感ですすめてきた

それぞれのスパコン

グローバル化、効率化、生産開発体制、CAEのリソース 一カ所で集約

いろいろな研究、作っている
細かい要望も多い、製品になっていないものも
さまざまなリクエストに答えるのが難しくなってきた

量産系も研究開発が優先
基礎研に割り当てるのも難しい
答えることに行き着いたのがクラウド

一週間だけ使うのも

2012夏
社内でも調達できず、社外に目を向けた
ユーザがもとめている三ヶ月で終わらない
審査とか
いがいに使えるところがない

リードタイム
スピードに答えられるか
待てない、今過ぎ使いたい

柔軟性
止めたいとき止めたい
時間単位で貸してくれるのも

最新のCPUも
スパコンは新しいコアが使いたいニーズにも答えられる
スポットインスタンスも

 

[slideshare id=41572733&doc=spot301-141114135304-conversion-gate01]

リソースの5倍持っている
AWSは、1AZ、1DCに五万台
HPCでクラウドでAWSは避けられない

うまく使えるように
速く使ったほうがいいのを伝えたい

電力の問題
オレゴン、EUフランクフルト カーボンフリー
これも1つの魅力

Cluster manager job schedular
Computing node スポットインスタンス or オンデマンド(スポットインスタンスですべてのリソースはカバーできないので、オンデマンドを併用しているとのこと)
計算が終わったら、、終了

1/3の期間で終了
ピーク時は16,000コア同時に使っている
70%のコスト際限
スポットインスタンスを併用する
スポットインスタンスはAZのキャパで起動できない場合があるので、オンデマンドと併用しているとのこと
オンプレでやったらい
非常に難しい
三ヶ月かかる損失も出さないと明確には出せない

調達コストは
16,000コア 16,000コア持っていないといけない 1/7

性能、ライセンス

ライセンスのビジネスモデル
商用ソフトウェアの対応がネック

InfiniBandをつんでいるものと同等
最大スケールまでは出せていない
今後に期待

ISVの反応が変わってきている。個人的な所感

でも、このあたりの進化はまだまだ

ユーザ主導型のエコシステム =クラウド

こうゆうものがほしい、 →サービスが増えていく →ユーザが増えていく →リリースの数も増えていく 加速度的に増えていく

リクエストも投げるのも手

声を上げる 変えることもでできる

クラウドリソースを使うべきか
計算リソースを持てないところも使えるようになる

変えないとついて行けない

5年後

クラウドはHPC使うのは当たり前
マルチクラウドの形でリソースを使って行ければと

会社の特徴も持っているクラウド業者も

ソフトウェアのライセンスの問題
性能などもある

考え方も変えていかなければならない

前向きにとらえてやっていくのがポイント クラウドユーザ次第

オンプレとクラウドをシームレスに

HPC分野も、AWSを筆頭に、クラウドは避けて考えることはできないと実感しました。IoTなどセンサーネットワークが今後広がっていることも考えます。

コメントは受け付けていません。