Differences between revisions 1 and 2
Revision 1 as of 2024-06-04 12:35:38
Size: 13083
Comment:
Revision 2 as of 2024-06-04 17:14:12
Size: 13325
Comment:
Deletions are marked like this. Additions are marked like this.
Line 2: Line 2:
 * 宮川、山本、押野、中垣、池田  * 宮川、山本、押野、池田、川本
Line 19: Line 19:
=== 1. IO chassis ===

 * (6/4) 2台のIO chassisを一つの電源に繋いで、1台落とすと、もう一台のリアルタイムモデルが落ちる。
  * 30Aを2台使い、1本のケーブルの空いているマイナス側に繋ぐ。
  * グリッチなのか突入電流なのか切り分ける。

Line 29: Line 36:

 * (6/4) https://gwdoc.icrr.u-tokyo.ac.jp/cgi-bin/private/DocDB/ShowDocument?docid=15586
  * ハードを変えるのが得そう。ソフトは3.5.1までなので、そこまで変える価値があるか?
   * ハードを変えておくと、GEN3が使えるようになった時にすぐにVer.5台に変更できる。
  * まずはPCとIO chassisをセンターの2階から入れ替え。
   * RFMは新しいPCではプロファイルの高さの関係で使えない。
Line 49: Line 62:
 * (3/5) X-endはケーブルのみ2023年度発注済み。工事は2024年度早々に発注。 -> (4/2)ケーブルが3/26に納品、4/2に工事発注。  * (6/4) Xendの工事完了。
Line 51: Line 64:
  * (6/4) Yendを100mで今年度中に工事?
Line 80: Line 94:



=== 6. IPC glitch ===

 * rtsystabの2つ目まではエラーが出ない。それ以降は出る。順序を変えると出方が変わるが、その影響が順序を変えていないところにもでる。
 * mx streamの立ち上げの引数の順序を直接変えて、mx streamを立ち上げ直したら切り分けができないか?
 * ethtoolでlatencyを遅くして影響が出るかみてみる。
 * latencyはDC0もRTPCも最小になっていると思われる。
 * アップデートで解決しないのか?
 * (9/5) NICの遅延設定で一旦は減るようだが、またモデルアップデートすると再現する。MX streamだけの再起動するとどうなるか?NICの2枚挿しは?

 * (11/7) 10月20日くらいから10日間くらい少ない時があった。フィルターバンクの増減、最終的には4つ減ったが、影響があるかどうかは不明。
  * LIGOはDAQをDolphinにO1くらいで移行している。
  * チャンネル数を減らすのは有効だろう。コミッショニングよりも観測の方がチャンネル数は少ないが、実際に減らすのは結構大変。

 * (2/6) エンドのモデルのリスタートでグリッチが増減することがあるので、RFMが関係か?Dolphinに置き換えたら改善するか?
 * (3/5) モデルの数は地震前と同じだが、モデルの負荷は軽減されているはず。少なくともIPC glitchは出ている。モデル再起動でglitchの数はランダムに上下する。
 * (4/2) NICの2枚挿テストを今週再度やってみる。


=== 7. 1ヶ月の進捗状況 ===
 * (6/4) puppetの手順書を書いている。



=== 5. IPC glitch ===

 * (4/2) DCのNIC(Myriyet)の2枚挿テストを今週再度やってみる。
  * (6/4) かなり減った。5/17に作業して、その後3週間くらいで3回出ただけ。NICのカード1枚のキャパシティーが超えていたと考えられる。
  * NIC1枚で16プロセル走らせることが可能。実際には二十数モデル走らせていたので、1モデル1プロセスになった。カードを増やしただけでなく、DCの2枚のカードごとのデータ量のバランスをとったことも効果があった。
 * MXのビルドオプションが2枚用になっているので、もしかしたら3枚オプションとかが可能かもしれない。

=== 6. 1ヶ月の進捗状況 ===
Line 129: Line 133:
 * (6/4) 4/2に送り返して、戻ってきたあとGPSアンテナのコネクタが壊れたの、霜出さんに修理してもらった。その後は安定して動いている。
  * (6/4) 3/19で時刻差が0秒から20n秒付近に変わった。(川本)
Line 164: Line 170:
 * (6/4) 結局リアルタイムモデルに時間差を実装して解決した。
Line 199: Line 207:
 * 次回: 57日(火) 16:00~
 * 次々回: 6月4日(火) 16:00~
 * 次回: 72日(火) 16:00~
 * 次々回: 8月6日(火) 16:00~

2024/6/4 16:00~ DGS meeting

  • 宮川、山本、押野、池田、川本


1. 2024年度予算

DGS total: 3100 -> 1550

  • Test bench for O5: 300
  • Dolphin: 900
  • IRIG-B card x10: 400
  • PC/Network maintenance: 300
  • 20bit ADC: 200 -> 2枚買えたら

  • 16bit ADC (現在rev.Cが13枚ある): 300 -> 4枚買えたら

  • Adnacom x20: 200
  • X end optical fiber cable: 100
  • Optical fiber cable at corner station for new IO chassis: 400

1. IO chassis

  • (6/4) 2台のIO chassisを一つの電源に繋いで、1台落とすと、もう一台のリアルタイムモデルが落ちる。
    • 30Aを2台使い、1本のケーブルの空いているマイナス側に繋ぐ。
    • グリッチなのか突入電流なのか切り分ける。

2. Dolphin

  • (2/6) DolphinのGEN3がLIGOでまだ使っていないので、もしかしたら使えない可能性がある。その場合GEN2を用意する必要があるが、そもそもまだ買えるかどうかもわからない。-> (4/2) GEN2が在庫なしということがわかった。

  • DGS upgradeが2025年1月以降。O5は2027年頭の予定、30ヶ月やる予定なので、2030年とか。
  • FrameCPPのバージョンが今のDAQだと対応できないかもしれない。もしDolphinもRFMも対応しないなら、自分たちで対応するように書き換えるか。
  • (3/5) LIGOではPX(GEN3)と次世代のMX(GEN4)をテストしているが問題がでる。
    • 我々はPXを持っている。別日程で、今後どうするか少し打ち合わせ。
  • DolphinドライバーがLIGOとDolphin社の間でしか使わない契約になっている。LIGOのほうでKAGRAが使えないか問い合わせてくれている。
  • (6/4) https://gwdoc.icrr.u-tokyo.ac.jp/cgi-bin/private/DocDB/ShowDocument?docid=15586

    • ハードを変えるのが得そう。ソフトは3.5.1までなので、そこまで変える価値があるか?
      • ハードを変えておくと、GEN3が使えるようになった時にすぐにVer.5台に変更できる。
    • まずはPCとIO chassisをセンターの2階から入れ替え。
      • RFMは新しいPCではプロファイルの高さの関係で使えない。

3. MTP光ファイバーケーブル

  • Endの1-2階間をどうするか?logn Dolphinを1、2階共に設置するか、計算機を(2階に)集めてIOシャーシを1台1階におく。1ー2階のネットワークも増やす。
    • IRIG-Bシャーシが2台浮くことになる。
  • 別計算機を立ち上げて、新IO chassisとDonphiin GEN3のテストをするといい。
    • O4bが始まる前に見込みをつけておいた方がいい。
    • V4が数台。Xeon Gold 27台ある。Dolphin(制御をDAQ)とIRIG-B、DGSを全てハーフハイトで。
    • DC0で16個のend point(スレッドに相当)が立ちあがる。30台のRTPCからデータを受け取る。コアが12個なので、入れ替えながら受け取る。NIC1台で32個のエンドポイントを扱えるのでNICを増やすか、コア数を増やすかするといい。エンドポイントを1ー2年前に8個から16個に増やした。
  • 古いIO chassisはGEN1で動いているので、biosのGEN3モードで動くかどうかのテストをする必要がある。
  • センター1階は予算があれば進める。最終的にはBSあたりとIOOあたりの2か所で、段階的にやってもいい。
  • エンドはMTPは無しでも良く、1-2階間のマルチモードの8芯以上の追加がX,Y共に必要。
  • センター2FのPCとIO chassisを置き換えることを考える。既存のものと一緒において、すぐに戻せるような体制でテスト。IRIG-BとFanoutを余らせるのがここでの最終目的。
  • (6/4) Xendの工事完了。
  • Y-endはシングルの24本を敷設したはずなので、それを使うか?マルチモードで使えるか、確認。
    • (6/4) Yendを100mで今年度中に工事?

4. テストベンチ

  • テストベンチもう1系統制作中(押野)
    • PX Dolphinのテスト -> 4kmはLIGOでもまだできてない。できているのはIX Dolphin。

    • Debian11
  • Center 1F <--> 2F 光ファイバーテスト

    • 1FにRTPC 2FにIOシャーシ or 1FにIOシャーシ 2FにRTPC
  • テストベンチのIRIGボードが2枚抜き取られている
    • X500にある?
    • (9/5) 台湾グループがLineノイズ解析のための2Uのサーバーをテストサーバ(結局コントロールルーム横のサーバー室)にとりあえず1台入れたがっている。Real timeとLow latencyでやることになるので、サイトにインストールすることが必要。LVKの翌週を考えている。窓口は山本君->PEMに引き継ぎが。

  • (11/7) LIGOのrunで使われていたRCGを使うのがいいのでは?例えば5.1.2。
  • (12/5) 三代君が以前バラしたIRIG-Bの基板が回路室から回収された。
  • (2/6) k1bootで現在のoptが動かなくて、元に戻しても動かなくなってしまった。-> 最初からつくりなおす。

  • (3/5) puppetを壊してしまったので、いくつか修理した。
  • (3/5) ADCのrev.Cでうまくタイミングが取得できることを(1/13枚で)確認した。JGWDocの情報を更新する予定。
  • (3/5) PX Dolohinのテストを中心にしばらく続ける。LIGOで動かせるようになるのをまって、KAGRAではインストール手法を確立しておく。
  • (3/5) 天文台でsqueezer用のものを作ろうと考えている。テストベンチ規模になるなら、使っていないV2を送るかもしれない。押野君が出張するかも。
  • (4/2) 同期が取れないのでDolphinが動かないのでは?なのでRTPCにIRIG-Bカードが必要なのでは?今のシステムだとTDSが必須なので、それでもIRIG-Bだけで動くようにコードを書き換える必要がありそう。
  • (4/2) 新しいTiming slaveは既存とコンパチみたいだが、今Danielがやっているものとはまた別のよう。
  • (4/2) bootサーバーを作り直した。RTモデルは動いたが、DCがレシーバーは動いているが、センダーがまだうまくいっていない。
  • (6/4) puppetの手順書を書いている。

5. IPC glitch

  • (4/2) DCのNIC(Myriyet)の2枚挿テストを今週再度やってみる。
    • (6/4) かなり減った。5/17に作業して、その後3週間くらいで3回出ただけ。NICのカード1枚のキャパシティーが超えていたと考えられる。
    • NIC1枚で16プロセル走らせることが可能。実際には二十数モデル走らせていたので、1モデル1プロセスになった。カードを増やしただけでなく、DCの2枚のカードごとのデータ量のバランスをとったことも効果があった。
  • MXのビルドオプションが2枚用になっているので、もしかしたら3枚オプションとかが可能かもしれない。

6. 1ヶ月の進捗状況

  • 時刻情報をすぐに比較できるようにしようと考えている。FPGAでSKのTDCというのを作るか?
    • LIGOのComparatorは?
  • (12/5) IMC susなどIO chassisの電源をACからDCに変えた。残りはIOO0,1 ALS。SR2がBSから数珠繋ぎになっているのは、配線依頼済み。エンドはまだいくつか、特に1階が手付かず。
    • その際、電圧降下で立ち上がりにくいことがあった。ラック側の電圧が落ちないように、根元で少し上げておくのがいい。
  • (12/5) k1bootが一旦落ちた。再起動で一お動き出した。システム領域にはディスクエラーはなかったが、データ領域にエラーが3つあった。でもそのエラーが落ちた理由とも思えない。
  • (12/5) minute trendが3月にいっぱいになるので、2月くらいに交換するといい。もう1系統バックアップを組んでおいた方がいいかも。-> 押野 -> k1nds0は完了して再起動した。knds1は今週再起動予定。

  • (2/6 ) WS周りのアップグレードの準備を始めている。大体は動くが、diagguiやfotonなどバージョンによって動かないものがある。Debian10のサポートが夏に終わるので、O4bが問題になるかも。古いバージョンを使うことはできるので、もしかしたら観測優先で使い続けるかも。自由に外部に出れるのが問題か?ホワイトリスト方式にして、proxyサーバを立てたりするのま?
  • (3/5) Nonsensという、リアルタイムでノイズのサブトラクションをするのがある。サイトで、リアルタイムモデル上で動く。ASC->LSCや電源ライン系のサブトラクトに使われている。ただし、それとは別にオフラインでサブトラクトしている。

  • (4/2) PCがちょくちょくダウンしている。2、3月で4台。古いRTSで数100日でダウンするバグがあるのかも。

8. GPS関連

  • KAGRAのGPSに4月に大きなジャンプが起きた。
  • SKに6月にCommon Viewの作業中に大きなジャンプが起きた。少なくとも4月には何もなかった。
  • 9/13 天文学会で特別セッションで発表する。
  • (5/9)衛星の数が正午に減るようなことはなさそう。
  • まとめのグラフができた。
  • (3/5) 川本君がやったことをまとめて話してくれるかも。時刻がズレる秒単位の比較のズレの「頻度」が変わると、ジャンプが起きるようだ。Timing masterを増やすか、Common Viewをもう一台増やして比較してみたい。
  • (4/2) common viewを修理で送りかえした。予備を買う?メンテナンスの更新。
  • (6/4) 4/2に送り返して、戻ってきたあとGPSアンテナのコネクタが壊れたの、霜出さんに修理してもらった。その後は安定して動いている。
    • (6/4) 3/19で時刻差が0秒から20n秒付近に変わった。(川本)

9. メンテンナス

  • 古いUPSバッテリーを一斉交換する。-> 山本 -> 9/6:すでに切れているものは交換した。O4までに、後2台残っている。

10. 玉木君のKEKでの実験

  • HPCD x4、AA/AI x1、WFx3 はある。サテライトボックスを確認。
  • STDAで構築、ADC1枚、DAC1枚。

12. IP 枯渇問題

  • 押野君がWS networkを立てる案を作ってくれた。
  • 10.60.10.XXのサブネットを変える。
  • Oは多分無理。1週間くらいのメンテナンスデーが欲しい。
  • 10/4 EPICS信号をTCP/IPのネットワークから分ける。(池田)
    • awgはnds経由で指令しているのか?
  • O4以前は諦める。

13. Interlock

  • (12/5) 11月に両エンドのリモート操作(MEDM経由)が可能になった。その後、自己判断するようなもの(ハードワイヤ)を組み込む。
  • (2/6) 1月後半に上久保田さんがきて、GVに入れる打ち合わせをした。
  • (3/5) 3/13-15に上久保田さんが来る。GVの1セット目の完成を目指す。 -> (4/2) 設計と打ち合わせをして、現在実装している最中。

=== 14. common mode servo ====

  • (4/2) 16dBから15dBの切り替えで、15dBも16dBも共にオンになり140usの間31dBになる。15dBから16dBの切り替えも同様になることがわかった。これまでの調査から少なくともデジタル側で問題がある。ソフトか、BOカードかはまだ不明。オフセットが問題ではなさそうなことが判明した。ソフト側でなさそうなこともわかった。
  • BOとBIOに違いがあるかをチェック。
  • (6/4) 結局リアルタイムモデルに時間差を実装して解決した。

長期的でやるタスク

  • 大きいモニターもいずれ交換。O4a後くらいか?
  • 坑内のIOO付近のWi-Fiを安定化させる。-> クリーンブース内を有線化

  • テストベンチ。
    • Dolphinが主流に。DAQもDolphin。
  • SINETのアップグレード
  • 坑内ネットワークのアップグレード
  • 新IO chassisをどう稼動させていくか?
    • 今回買った計算機で稼動
  • RGCのアップグレード
  • DCの冗長化
  • 20bit DAC
  • 18bit ADC
  • タイミング関連が変わる。
  • 計算機のreplace
  • 回路の交換
  • 柏と神岡の10G化
  • 柏が止まる時の逃げ道、冗長性など
  • 予算

To do

ケーブル

  • 計算機室の出口のケーブル整理。

その他

  • D-SUB37pinケーブルを作る。-> 必要なケーブルの種類とラフな本数を見積もる。

今後の予定

  • 次回: 7月2日(火) 16:00~
  • 次々回: 8月6日(火) 16:00~

KAGRA/Subgroups/DGS/Meeting/20230604/minute (last edited 2024-06-04 17:14:12 by OsamuMiyakawa)