[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

[gfarm-discuss-ja:01482] Re: Gfarmの複製機能に関する質問



bootstrapでは、それぞれのファイルに対してファイル複製作成
のリクエストを出す必要があるため、小さいファイルのファイル
複製をたくさん作成する場合オーバヘッドが大きくなります。

それに対しgfrepbe_{client,server}では、ファイルのリストに
対してファイル複製作成のリクエストをまとめて出すことができ
るため、そのオーバヘッドが解消できます。実際、これはSC2003
のバンド幅チャレンジで、それぞれのファイルサイズが比較的
小さいすばる望遠鏡の大量のデータの複製を、アメリカから日
本に作成したときに利用したものですが、これにより、理論ピー
ク性能の97%の 3.79 Gbps のバンド幅を安定して達成すること
ができました。
#もちろんさらにGNET-1という箱を利用したことが安定性能の
#鍵ですが、上記のバンド幅を大量の小さいファイルのファイ
#ル複製作成で達成したのはgfrepbe_*のおかげです。

あと、gfsdのプロトコルでファイル複製を作成するのではなく
gfrepbe_* という外部プログラムを利用することにしたのは、
最適化などのための変更のたびに gfsd(のプロトコル)を更
新するのが大変だったからということもあります。まぁ、更
新したらgfrepbe_*を更新しなければならないので、それでも
大変は大変ですが。
#ちなみに、gfrepbe_*自体のファイル複製作成をする必要があ
#るということで、gfsdのプロトコルによるファイル複製作成
#はbootstrapと名前が変更されました。

建部@筑波大

On Wed, 30 May 2007 02:02:08 +0900
"Hitoshi Sato" <hitoshi.sato@xxxxxxxxxxxxxxx> wrote:

> 東工大 佐藤です.
> お世話になっております.
> 
> ありがとうございます.理解しました.
> 
> GFARM_REPLICATION_BOOTSTRAP_METHODと比べて,gfrepbe_{client,server}が小さいファイルの複
> 製作成をたくさん行う場合に有効な点は具体的には何なのでしょうか?複製作成の早さ,MDSへの負荷の低さなどなのでしょうか?また,それは実装上どのよ
> うな違いに起因するのでしょうか?
> 
> >1対多は現在の研究テーマとなっています。。。協力してもらえるとうれ
> しいですが。。。
> 
> 是非,協力させていただきたいです.
> 現在,gfarmでパイプライン転送による複製作成ができないか
> (もっと言うと,複製作成手法にもっとバリエーションを持たせることができないかどうか)どうか検討していて,
> どのように実装すべきかで,不明な点があったため,質問させていただいた次第です.
> 
> さしあたり,GFARM_REPLICATION_BOOTSTRAP_METHODに倣うのが良さそうですね.
> 
> 07/05/29 に Osamu Tatebe <tatebe@xxxxxxxxxxxxxxxx> さんは書きました:
> >
> > 現在はBOOTSTRAP_METHODの方しか利用していません。そうではない方は
> > gfrepbe_{client,server}という外部プログラムを利用するもので、特に
> > 小さいファイルの複製作成をたくさん行う場合に有効な方法です。ただ、
> > 最近使っていないので動作確認がとれていません。
> >
> > parallelとsequentialの違いはその通りです。parallelでは並列TCPスト
> > リームを利用して1ファイルをストライプして転送します。.gfarmrcに
> >
> > netparam parallel_streams=4 *
> >
> > などと記述すると並列ストリームを利用します。
> >
> > 1対多は現在の研究テーマとなっています。。。協力してもらえるとうれ
> > しいですが。。。
> >
> > 建部@筑波大
> >
> > On Tue, 29 May 2007 15:07:41 +0900
> > "Hitoshi Sato" <hitoshi.sato@xxxxxxxxxxxxxxx> wrote:
> >
> > > 東工大の佐藤と申します。
> > > いつもGfarmを使用させていただいております。
> > >
> > > Gfarmの複製機能について疑問点があるので、いくつか質問させてください。
> > >
> > >
> > ・gfs_replicate.cの中をみると,GFARM_REPLICATION_NORMAL_METHODとGFARM_REPLICATION_BOOTSTRAP_METHODの
> > > 2つメソッドがあるのですが,これらはどのような違い(使用用途やできることなど)があるのでしょうか?
> > > 今後、GFARM_REPLICATION_BOOTSTRAP_METHODの方は使わなくなっていく方向なのでしょうか?
> > >
> > > ・現在使用しているgfarm(v1.4.1
> > > )では,ライブラリ関数(gfs_url_section_replicate_from_to)を用いて複製を作成し
> > > ようとした場合,GFARM_REPLICATION_BOOTSTRAP_METHODで起動して,複製作成先のgfsd上に要求が行われて複製が作成
> > >
> > するみたいなのですが,parallelとsequentialの違いはは単に1対1のホスト間でデータをかたまりで送るのと分割して送るのとの違いだけなのでしょうか?また,parallelの複製方法をライブラリ関数経由で呼び出すには、どのようにするべきなのでしょうか?
> > >
> > > ・gfarmのレプリケーション機能で1対多ノード間のpipeline転送をサポートする計画はあったりするのでしょうか?
> > >
> > > 以上、よろしくお願いいたします。
> > >
> > > --
> > > 東京工業大学
> > > 情報理工学研究科 数理・計算科学専攻
> > > 佐藤 仁 <hitoshi.sato@xxxxxxxxxxxxxxx>
> >
> 
> 
> 
> -- 
> 東京工業大学
> 情報理工学研究科 数理・計算科学専攻
> 佐藤 仁 <hitoshi.sato@xxxxxxxxxxxxxxx>