Differences between revisions 4 and 5
Revision 4 as of 2017-09-11 14:53:47
Size: 5954
Comment:
Revision 5 as of 2017-09-11 17:10:07
Size: 7038
Comment:
Deletions are marked like this. Additions are marked like this.
Line 9: Line 9:
  * k1bootの常時バックアップを設定する。nfsで/opt以下をバックアップ。   * k1bootの常時バックアップを設定する。k1nfs0で/opt/以下をマウントして、/opt/以下をバックアップ。
  * バックアップに1日くらいかかっている。archiveが大きいので、無駄にバックアップしている。
Line 14: Line 16:
Line 17: Line 20:
 * FW1が再起動を繰り返した問題の解決。
  * minute rawが原因(山本、宮川)
  * minute rawのファイルサイズが200バイトで割り切れなくてはならない。(宮川)
  * minute rawの書き込み失敗が原因でファイルサイズがおかしくなった。書き込み失敗の理由はDiskがいっぱいになったから。(山本)
  * minute rawが過去の遅いデータを全て記録している。現在300GB程度。
 * k1fw1が再起動を繰り返した問題の解決。
  * minute_rawが原因(山本、宮川)
  * minute_rawのファイルサイズが200バイトで割り切れなくてはならない。(宮川)
  * minute_rawの書き込み失敗が原因でファイルサイズがおかしくなった。書き込み失敗の理由はDiskがいっぱいになったから。ファイルサイズを治すプログラムも作った。(山本)
  * minute_rawが過去の遅いデータを全て記録している。現在300GB程度。
  * 結局2週間分くらいが落ちてしまった。
Line 27: Line 32:
 * k1prm電源問題。(宮川)
  * 1250Wの電源を試した。13枚(ADC8, DAC2, BO3)まで動いて、のちに不安定になり12枚(ADC7, DAC2, BO3)で安定稼働。
 *
bios update。(宮川)

* k1pr0電源問題。(宮川)
  * カードの枚数を増やしたらIO chassisが途中で認識しなくなる。
  * 7
50Wの電源を交換して1250Wの電源を試した。テストベンチで13枚(ADC8, DAC2, BO3)まで動いて、のちに不安定になり12枚(ADC7, DAC2, BO3)で安定稼働。のちにk1pr0にインストール。
   * ダミーのADC0を入れないと、スレーブでADCのチャンネルが定義されない。

 * テストベンチのRT PCの
bios update。(宮川)
  * これまで4枚程度しか認識しなかったカードが13枚までは確認できた。
Line 31: Line 42:
  * これまで10Aの電源だと4枚程度までだったのが、30Aの電源(実際には20Aに制限)で+側の24V片側駆動で12枚まで(ADC7, DAC2, BO3)載せることができた。まだ余裕がありそう。定常時に4A流れることを確認。   * これまで10Aの片側電源だと4枚程度までだった(山本)のが、30Aの電源(実際には20Aに制限)で+側の24V片側駆動で12枚まで(ADC7, DAC2, BO3)載せることができた。まだ余裕がありそう。定常時に4A流れることを確認。
  * 次は坑内で遠距離のテスト。
Line 33: Line 46:
  * DACのアダプターカード挿すと発生する問題。DAC自身は関係ない。
Line 34: Line 48:
Line 35: Line 50:
  * 引き続き開発。   * サーバーが立ち上がり、そこにログインすればMEDMが見える。宇宙線研LANの中に入ればReadonlyでみえる。
  * epicsgatewayを立ち上げているが、なぜか本システムがReadonlyになる問題がある。
  * MEDMくらいしか実行できないようにしてある。
   * dataviewerは使えるようになった。DTTが難しい。TPが読めないが、それはTPを使いすぎないという意味でOK。
  * 公開はあと少し先。
Line 37: Line 57:
  * テストで使えるくらいにはなった。
  * カテゴリー分けなどを検討する必要がある。
  * サーバーをgwwikiに移す。
Line 38: Line 61:
 * モデルのテコ入れ。
  * libraryのバージョン
  * filterbankの数の制限
Line 40: Line 67:
  * Common Viewのアップデートと整備が完了。年間メンテナンス契約を結んだ。
   * アンテナをどうするか?
Line 46: Line 71:
  * Timingマスターの内部クロックOCXOの34MHzなので、20nsはそれほど間違っていない。
  * Timing masterとGPSレシーバーとのcomparatorで比較をする予定。
  * GPSとどれくらいずれがあるかなどをこれから調べる。
   * common viewで調べることができる。
   * Common Viewのアップデートと整備が完了。年間メンテナンス契約を結んだ。
    * アンテナをどうするか?
  * 坑内の相対的なずれの原理を調べる。
Line 49: Line 77:
 * ISSのモデルはIMMTで最初試す。
Line 55: Line 84:
   * IMMT用のDACボードを入れた。
   * ラック内回路位置の図を作った。
   * 回路などのラック内での整理。
   * 学生の組織的な手配が必要か?
Line 59: Line 88:
   * 余りになるので、k1lscに移すなどする。    * テスト用に使っている。
Line 62: Line 91:
   * 回路の数をすやすために二つ目のラックを追加した。    * 稼働しているが、様子を見る。
Line 65: Line 94:
   * 18Vはk1bsの電源を使っている。    * 稼働中。
Line 68: Line 97:
   * 18Vは電源を回路室からに切り替えた。
   * Hyper thredingをオフにする。
   * ケーブルを整理して欲しい。
   * 稼働中。
Line 73: Line 100:
   * ラックを追加した。    * ラックを追加した。Phase1で使わないので、もしかしたら繋ぐ必要がないかも。
Line 81: Line 108:
   * 回路ラックを移動した。
Line 87: Line 113:
   * CRYを含めると3枚目のDACが必要そう。    * 稼働中。
Line 93: Line 119:

 * Field rack関係
  * シールを貼る。
Line 98: Line 120:
  * DT ADCが必要だというこがわかってきた。現在k1imc, k1ey0が上手く行かない。他はDT ADCの値は固定されたが、数字の種類が2-3種類ある。   * DT ADCについてもう少し理解が必要。
Line 101: Line 123:
  * タイミング信号を坑内に持っていっている。
Line 104: Line 125:
  * X endの計算機を使って整理。128まだだと足りなくなるので、256位まで拡張するか? -> テストベンチでまずはテストしてみる。(山本)
  * IOPの10番台が動かないので、計画変更が必要。
  * IMCだけ残っている。いつか交換。
Line 108: Line 128:
  * 今年度夏頃に、購入で進んでいる。
  * 今年度夏頃に、購入で進んでいる。10月末に来る予定。
Line 119: Line 138:
 * X arm 1500mのラックを新規に作らないといけない。
Line 122: Line 142:
 * 次回打ち合わせは911日午後4時からの予定。  * 次回打ち合わせは1023日午後4時からの予定。

Digital system subgroup meeting on 2017/9/11 16:00-17:00 (JST)

  • 出席者: 宮川、上泉、霜出、山本、鍛治、横澤


1. 現状のタスク確認

  • k1bootバックアップ。(山本)
    • k1bootの常時バックアップを設定する。k1nfs0で/opt/以下をマウントして、/opt/以下をバックアップ。
    • バックアップに1日くらいかかっている。archiveが大きいので、無駄にバックアップしている。
  • k1boot移動。(宮川)
    • これまでの1Uの最古のPCから2Uのものに変更した。1Uのものはk1buildに使用。
    • ケーブルが相当くちゃくちゃだった。かなりテコ入れした。
    • k1camの移動が残っている。
  • k1build稼働開始。(宮川)
    • 最初ビルドが遅いという問題があったが、時刻のずれが問題で、ntpで合わせて解決。
  • k1fw1が再起動を繰り返した問題の解決。
    • minute_rawが原因(山本、宮川)
    • minute_rawのファイルサイズが200バイトで割り切れなくてはならない。(宮川)
    • minute_rawの書き込み失敗が原因でファイルサイズがおかしくなった。書き込み失敗の理由はDiskがいっぱいになったから。ファイルサイズを治すプログラムも作った。(山本)
    • minute_rawが過去の遅いデータを全て記録している。現在300GB程度。
    • 結局2週間分くらいが落ちてしまった。
  • 坑内ストレージの追加を検討。3TBのDisk9台をそれぞれ増設予定。(宮川)
  • RT modelがよく死ぬ問題の解決。(宮川)
    • Dolphinが原因。Dolphinスイッチに繋がれた計算機の電源を落としたり、立ち上げたり、スイッチ自身の電源を切ったり、入れたりした時に、RT modelにDolphinライブラリでやり取りが書き込まれているモデルが落ちる。
    • RT modelにDolphinライブラリを使っていない計算機のケーブルを、スイッチから外した。
  • k1pr0電源問題。(宮川)
    • カードの枚数を増やしたらIO chassisが途中で認識しなくなる。
    • 750Wの電源を交換して1250Wの電源を試した。テストベンチで13枚(ADC8, DAC2, BO3)まで動いて、のちに不安定になり12枚(ADC7, DAC2, BO3)で安定稼働。のちにk1pr0にインストール。
      • ダミーのADC0を入れないと、スレーブでADCのチャンネルが定義されない。
  • テストベンチのRT PCのbios update。(宮川)
    • これまで4枚程度しか認識しなかったカードが13枚までは確認できた。
  • 新しいDC-DC電源テスト。(宮川)
    • これまで10Aの片側電源だと4枚程度までだった(山本)のが、30Aの電源(実際には20Aに制限)で+側の24V片側駆動で12枚まで(ADC7, DAC2, BO3)載せることができた。まだ余裕がありそう。定常時に4A流れることを確認。
    • 次は坑内で遠距離のテスト。
  • Timing 999996問題。(宮川)
    • DACのアダプターカード挿すと発生する問題。DAC自身は関係ない。
    • テストベンチでの検証の結果、RT moduleを直接rmmod, insmodすることで多少解決するに見えたが、k1pr0では通用しなかった。再度テストベンチでに帰って、負荷をかけた状態で試す。
  • Remote Epics(山本)
    • サーバーが立ち上がり、そこにログインすればMEDMが見える。宇宙線研LANの中に入ればReadonlyでみえる。
    • epicsgatewayを立ち上げているが、なぜか本システムがReadonlyになる問題がある。
    • MEDMくらいしか実行できないようにしてある。
      • dataviewerは使えるようになった。DTTが難しい。TPが読めないが、それはTPを使いすぎないという意味でOK。
    • 公開はあと少し先。
  • Bugzilla(山本)
    • テストで使えるくらいにはなった。
    • カテゴリー分けなどを検討する必要がある。
    • サーバーをgwwikiに移す。
  • モデルのテコ入れ。
    • libraryのバージョン
    • filterbankの数の制限
  • Timing delay測定(鍛治)
    • テストベンチで遅延のズレを測定すると、ポートに依存して遅延が変わることがあることがわかった。ケーブルの長さを同じにすると遅延が変わるが、違う長さだと遅延の違いがなくなる。オーダーとしては遅延そのものが20nsくらい、ポートごとのずれが10nsのオーダーで違いが見える。
    • 14kmの遅延を測定した。ただし、Testbenchからだと測定できるが、Masterからだと測定できなかった。スプライスボックスによるロスが原因だと思われる。
    • 結果は20ns程度のズレしか見られない。これは補正による。
    • FPGAのソースコードは発見できた。
    • GPSとどれくらいずれがあるかなどをこれから調べる。
      • common viewで調べることができる。
      • Common Viewのアップデートと整備が完了。年間メンテナンス契約を結んだ。
        • アンテナをどうするか?
    • 坑内の相対的なずれの原理を調べる。
  • ISSのモデルはIMMTで最初試す。

2. Rackの状況

  • k1ioo
    • 稼働中。
  • k1imc
    • 回路などのラック内での整理。
    • 学生の組織的な手配が必要か?
  • k1immt
    • テスト用に使っている。
  • k1pr0
    • 稼働しているが、様子を見る。
  • k1pr2
    • 稼働中。
  • k1bs
    • 稼働中。
  • k1sr3
    • ラックを追加した。Phase1で使わないので、もしかしたら繋ぐ必要がないかも。
  • k1lsc
    • ラックを追加した。
  • k1ex0
    • 特に問題なし。
  • k1ex1
    • 数10Hzと960Hz付近のノイズが大きい。
  • k1ey0
    • 特に問題なし。
  • k1ey1
    • 稼働中。
  • k1px1
    • 温度計が動いていない。Wireless routerの2.4GHzが死んでいる。
  • Timing関係
    • DT ADCについてもう少し理解が必要。
  • Test bench関係
  • DCUID
    • IMCだけ残っている。いつか交換。
  • Timing機器
    • 今年度夏頃に、購入で進んでいる。10月末に来る予定。

3. その他

  • daqd再起動をどうするか。VISは自分で押すスイッチを作った。
  • diagguiは閉じる、コントロールルームのスクリーンを閉じるというルールを作る。
  • RT modelのリスタートでDAQが死ぬことがある。
  • DAQトラブルで、RTPCを全て再起動しなければならないことがある。原因不明。
  • MEDM: PV info: defaultで落ちる。
  • X arm 1500mのラックを新規に作らないといけない。


  • 次回打ち合わせは10月23日午後4時からの予定。

KAGRA/Subgroups/DGS/Meeting/20170911/minute (last edited 2017-09-11 17:10:07 by OsamuMiyakawa)