Digital system subgroup meeting on 2017/9/11 16:00-17:00 (JST)
- 出席者: 宮川、上泉、霜出、山本、鍛治、横澤
1. 現状のタスク確認
- k1bootバックアップ。(山本)
- k1bootの常時バックアップを設定する。k1nfs0で/opt/以下をマウントして、/opt/以下をバックアップ。
- バックアップに1日くらいかかっている。archiveが大きいので、無駄にバックアップしている。
- k1boot移動。(宮川)
- これまでの1Uの最古のPCから2Uのものに変更した。1Uのものはk1buildに使用。
- ケーブルが相当くちゃくちゃだった。かなりテコ入れした。
- k1camの移動が残っている。
- k1build稼働開始。(宮川)
- 最初ビルドが遅いという問題があったが、時刻のずれが問題で、ntpで合わせて解決。
- k1fw1が再起動を繰り返した問題の解決。
- minute_rawが原因(山本、宮川)
- minute_rawのファイルサイズが200バイトで割り切れなくてはならない。(宮川)
- minute_rawの書き込み失敗が原因でファイルサイズがおかしくなった。書き込み失敗の理由はDiskがいっぱいになったから。ファイルサイズを治すプログラムも作った。(山本)
- minute_rawが過去の遅いデータを全て記録している。現在300GB程度。
- 結局2週間分くらいが落ちてしまった。
- 坑内ストレージの追加を検討。3TBのDisk9台をそれぞれ増設予定。(宮川)
- RT modelがよく死ぬ問題の解決。(宮川)
- Dolphinが原因。Dolphinスイッチに繋がれた計算機の電源を落としたり、立ち上げたり、スイッチ自身の電源を切ったり、入れたりした時に、RT modelにDolphinライブラリでやり取りが書き込まれているモデルが落ちる。
- RT modelにDolphinライブラリを使っていない計算機のケーブルを、スイッチから外した。
- k1pr0電源問題。(宮川)
- カードの枚数を増やしたらIO chassisが途中で認識しなくなる。
- 750Wの電源を交換して1250Wの電源を試した。テストベンチで13枚(ADC8, DAC2, BO3)まで動いて、のちに不安定になり12枚(ADC7, DAC2, BO3)で安定稼働。のちにk1pr0にインストール。
- ダミーのADC0を入れないと、スレーブでADCのチャンネルが定義されない。
- テストベンチのRT PCのbios update。(宮川)
- これまで4枚程度しか認識しなかったカードが13枚までは確認できた。
- 新しいDC-DC電源テスト。(宮川)
- これまで10Aの片側電源だと4枚程度までだった(山本)のが、30Aの電源(実際には20Aに制限)で+側の24V片側駆動で12枚まで(ADC7, DAC2, BO3)載せることができた。まだ余裕がありそう。定常時に4A流れることを確認。
- 次は坑内で遠距離のテスト。
- Timing 999996問題。(宮川)
- DACのアダプターカード挿すと発生する問題。DAC自身は関係ない。
- テストベンチでの検証の結果、RT moduleを直接rmmod, insmodすることで多少解決するに見えたが、k1pr0では通用しなかった。再度テストベンチでに帰って、負荷をかけた状態で試す。
- Remote Epics(山本)
- サーバーが立ち上がり、そこにログインすればMEDMが見える。宇宙線研LANの中に入ればReadonlyでみえる。
- epicsgatewayを立ち上げているが、なぜか本システムがReadonlyになる問題がある。
- MEDMくらいしか実行できないようにしてある。
- dataviewerは使えるようになった。DTTが難しい。TPが読めないが、それはTPを使いすぎないという意味でOK。
- 公開はあと少し先。
- Bugzilla(山本)
- テストで使えるくらいにはなった。
- カテゴリー分けなどを検討する必要がある。
- サーバーをgwwikiに移す。
- モデルのテコ入れ。
- libraryのバージョン
- filterbankの数の制限
- Timing delay測定(鍛治)
- テストベンチで遅延のズレを測定すると、ポートに依存して遅延が変わることがあることがわかった。ケーブルの長さを同じにすると遅延が変わるが、違う長さだと遅延の違いがなくなる。オーダーとしては遅延そのものが20nsくらい、ポートごとのずれが10nsのオーダーで違いが見える。
- 14kmの遅延を測定した。ただし、Testbenchからだと測定できるが、Masterからだと測定できなかった。スプライスボックスによるロスが原因だと思われる。
- 結果は20ns程度のズレしか見られない。これは補正による。
- FPGAのソースコードは発見できた。
- GPSとどれくらいずれがあるかなどをこれから調べる。
- common viewで調べることができる。
- Common Viewのアップデートと整備が完了。年間メンテナンス契約を結んだ。
- アンテナをどうするか?
- 坑内の相対的なずれの原理を調べる。
- ISSのモデルはIMMTで最初試す。
2. Rackの状況
- k1ioo
- 稼働中。
- k1imc
- 回路などのラック内での整理。
- 学生の組織的な手配が必要か?
- k1immt
- テスト用に使っている。
- k1pr0
- 稼働しているが、様子を見る。
- k1pr2
- 稼働中。
- k1bs
- 稼働中。
- k1sr3
- ラックを追加した。Phase1で使わないので、もしかしたら繋ぐ必要がないかも。
- k1lsc
- ラックを追加した。
- k1ex0
- 特に問題なし。
- k1ex1
- 数10Hzと960Hz付近のノイズが大きい。
- k1ey0
- 特に問題なし。
- k1ey1
- 稼働中。
- k1px1
- 温度計が動いていない。Wireless routerの2.4GHzが死んでいる。
- Timing関係
- DT ADCについてもう少し理解が必要。
- Test bench関係
- DCUID
- IMCだけ残っている。いつか交換。
- Timing機器
- 今年度夏頃に、購入で進んでいる。10月末に来る予定。
3. その他
- daqd再起動をどうするか。VISは自分で押すスイッチを作った。
- diagguiは閉じる、コントロールルームのスクリーンを閉じるというルールを作る。
- RT modelのリスタートでDAQが死ぬことがある。
- DAQトラブルで、RTPCを全て再起動しなければならないことがある。原因不明。
- MEDM: PV info: defaultで落ちる。
- X arm 1500mのラックを新規に作らないといけない。
- 次回打ち合わせは10月23日午後4時からの予定。