第21回 HPF合同検討会 議事録

  1. 日時 : 2000年1月28日(金) 13:30〜17:20

  2. 場所 : 地球フロンティア会議室 (浜松町)

  3. 出席者: 以上19名

  4. 配布資料
  5. 新規会員紹介
    NEC村井氏が新規会員として紹介された。ベンダの立場から参加。

  6. 前回議事録確認
    ベンダごとの動作は今日の同議題のときに確認

  7. 検討議事
    1. VPP800におけるHPFの評価について(安田)
      • 報告の詳細は配布資料を参照
      • コメント
        F90(1CPU)はarowを使う形になっている
        → arow 1行ずつではなくまとめてやれば、もうすこしはやくなるかも(岡部)
        jahpfを入れるとまた移植性がなくなるのでは?(中村)
        → HPF/JAの将来の拡張案の一つになりえる(岡部)
        full shadow+refrectは、VPPではunifyになるから同等性能は出せると思う(岩下)
        broadcastパターンをHPF/JAで書けるような拡張が必要では?(岡部)
        → dynamic/remappingを使えば、シングル分散→全分散へのリマップで書ける?(太田)
        ローカル配列はHPFの根本思想になじまない。なるべく入れないでという方針でやってきた。どうしてもダメなら入れざるを得ないが(妹尾)

    2. VPPのHPFコンパイラ評価(坂上)
      • 3次元流体コード
        自動並列化されないー>ON INDEPを挿入
        通信コードの効率が悪い→LOCALを挿入
        性能はよくなったが結果が正しくない→SHADOW、REFLECTを挿入した
        なぜか内側がベクトル化されなくなった
        →SHADOWの扱いに機能不足→コンパイラの機能アップ
        外側並列、内ベクトルだがREFLECTが正しく実行されない
        →コンパイラのバグ→最適化禁止オプションで回避できた
        16台以上では実行できない
      • 並列性能
              メッシュ数 168x168x168
              台数 スピードアップ 並列効率
                1       1.00       100.00
                2       1.98        99.27
                4       3.88        97.02
                8       7.42        92.89
               12      10.27        86.41
               14      11.68        84.49
              スピードアップ=1台のユーザタイム/プロセッサの最長ユーザタイム
              並列効率=1台のユーザタイム/全プロセッサのユーザタイムの和
        
      • コメント
        LOCALを入れないといけないのがつらい
        explicitでこの性能だと使えない(中村)
        通信は基本的にSHIFTだけ。1箇所リダクションがある
        通信は(REFLECT以外)全部要素転送なので、これではダメ(岡部)

    3. Cenju-4におけるHPFの評価(高橋)
      • 報告の詳細は配布資料参照
      • コメント x,y,zスイープのあと逆変換でz,y,xとスイープする場合、くくりだし方式による再分散では無駄な転置が出る
        → distributhionのスコープ、ブロックrange等があればいい?(岡部)
        対象ループがいくつ、サブルーチンがいくつのときに変更量がいくら、と正規化して議論欲しい(中村)
        コンパイラ固有ライブラリルーチンの仕様は公開できないのか?(岡部)
        → できなくはないが、その情報があってもユーザにとってあまり有用ではないのでは

    4. プロクラムインターフェースの標準化(太田)
      • 内容の詳細は配布資料参照
      • 議論/コメント 仮引数のデフォルトマッピング
        → INHERITにすると性能が悪くなることが多い
        → まだ議論が必要か
        明示的指定のないSHADOW
        → 日立方式、富士通方式の間では議論がある。
        → オプションで選べるようにしてほしい(坂上)
        shrunk
        → block dataない場合にもcommonがshrunkにならないのは受け入れがたい(坂上)
        他言語系とのinteroperability
        → MPIからHPFを呼び出せる枠組みがほしい(中村)
        演算順序の保証
        → それほど必要性はないのでは?
        通信最適化のバッファ領域の制御(速度とメモリ量のトレードオフ)
        → 実行時に勝手に使うメモリ量の上限を指定したい(岡部)
        → HPFの範囲だけにとどまらない問題になるので実装が困難(岩下)
        → メモリがなくなったら、ないなりに動いて欲しい(遅くてもいいから落ちないで欲しい)(中村)
        計時機能
        → 暫定仕様でも決めて欲しい(岡部)
        → ほとんど名前だけの問題なので、ベンダ間で調整する(妹尾)
        → バリアあり版、なし版の2種類
        乱数は?(岡部)
        → F90の乱数ルーチンは並列実行されない
        → プロセッサ台数分の種を用意すればいい
        → 台数を意識したコーディングはしたくない(中村)
        メッセージ出力
        → 通信の発生個所、量、パターンが最低限の情報(坂上)
        → 実行時に行われた情報を(ソース込みで)表示してほしい(中村)
        FortranをHPFで処理できるか?
        → sequenceをデフォルトにするオプションがあればいい?(岡部)
        ノーチェックでぎちぎちに速いオブジェクトを出すオプションが欲しい
        → 混在した場合にもちゃんと動くのが望ましい(-gオプションのように)
        independentに対してnewをデフォルトにするオプションが欲しい(中村)
        → 引き続きベンダで調整

    5. ユーザコード会員のHPF化状況
      • 中村 (航技研)
        3次元乱流シミュレーション、CFDコード、構造メッシュ
        コードは用意したがアカウントがまだとれていない。
        → 各社に送って評価してもらう
        公開は?
        → 坂上先生が収集、とりまとめ
      • 中尾(三菱重工)
        3次元ナビエストークス
        オイラー方程式、直交格子、AUSM-DV、LU-ADI
        Cenju-4向けに着手したところ。不規則性のある部分で行き詰まっている
        公開は難しい
        → エッセンスだけ取り出したカーネルプログラムが作れないか?
      • その他の方は作業中。次回報告

    6. HUG2000について(妹尾)
      RISTでパンフレット作成
      会場は押さえた
      CFP作成とスケジュールを決める
      → 次回JAHPFまでには
      宣伝活動をよろしく
      → 東工大ヤベ先生がいい結果を持っていそう(?)
      → コンタクトを取ってみる(妹尾)

  8. 連絡事項その他 RISTで用意できる計算機環境は2/25までの利用です。

  9. 次回予定 4月21日(金)13:30〜
    ただし発表の予定のある会員の予定を優先して変更の可能性あり
    HUGに向けて成果を出したい
    ユーザの輪をもっと広げたい


以上