停電作業手順
坑内停止
X/Y-end
- 回路類の停止を確認 [1F]
- DC18Vの停止 [1F]
- 計算機の停止 [1F]
- IO chassisの停止 [1F]
- DC12Vの停止 [1F]
- Workstationの停止 [1F]
- KVMの停止 [1F]
- ブレーカーを切る(1番、2番) [1F]
- 回路類の停止を確認 [2F 防振室]
- DC18Vの停止 [2F 前室]
- 計算機の停止 [2F 前室]
- IO chassisの停止 [2F 防振室]
- DC12Vの停止 [2F 前室]
- DC24Vの停止 [2F 前室]
- Workstationの停止 [2F 防振室]
- RFMの停止 [2F 前室]
- KVMの停止 [2F 前室]
- ブレーカーを切る(1番、5番、6番) [2F 前室]
X-arm
- 回路類の停止を確認
- DC18Vの停止
- 計算機の停止
- IO chassisの停止
- RMFの停止
- KVMの停止
- UPSの停止
- ブレーカーを切る(2つ) [外]
GigEカメラ
- IOO0、SRM、OMC0ラックのネットワークスイッチのACケーブルを抜く k1cam0,1を停止
Center 2F
- 回路類の停止を確認 [防振室]
- DC18Vの停止 [(今は)防振室]
- 計算機の停止 [前室]
- IO chassisの停止 [防振室]
- DC12Vの停止 [前室]
- Workstationの停止 [(今は)前室]
- ブレーカーを切る
Center 1F
- 回路類の停止を確認 [中央実験室]
- ラック内DC18Vの停止 [中央実験室]
- Workstationの停止 [BS, IOO area]
- RTFEの停止 [計算機室]
- IO chassisの停止 [中央実験室]
- DC18/24Vの停止 [計算機室]
- DC12V for timingの停止 [PR2, SR3 rack]
- k1nds[01], k1fw[01], k1tw[01], k1dc0の停止 [計算機室]
- DC12V for timing の停止 [計算機室]
- hyades-[01]の停止 [計算機室]
- 20TiBディスクの停止 [計算機室]
- k1scriptの停止 [計算機室]
- k1bootの停止 [計算機室]
- UPSの停止 [計算機室]
- DC電源マスターコントローラーの停止
- エアコンの停止 [計算機室]
- プレハブ内の分電盤でブレーカーを落とす、ただしPHSは落とさない。PHSのUPSを計算機のものに切り替えた場合は、それらのラックのブレーカーも落とさない。
- PHSのUPSを計算機側のUPSに切り替えるかも
坑内復旧
- o 下から順番に起動する
復旧後の確認事項
- 認識されるカード枚数が合っているか
Trouble-shooting
- IRIGBの時刻がUTCの時
local -> UTC -> local -> GPS -> local の順番でスイッチを切り替える
柏停電時の神岡対応
停止手順
- 柏ディスクのアンマウント@k1nds2 (主データ保管装置停止前)
root@k1nds2# umount -l /frames
- 玄関PCディスクのアンマウント@k1script1 (DHCPサービス停止前)
root@k1script1# /home/controls/Pictures/entrance
復帰手順
- 玄関PCディスクの再マウント@k1script1 (DHCPサービス復旧後)
- IPアドレス更新
### k1script1:/home/controls/.ssh/config Host entrance Hostname 1.2.3.4 ### k1script1:/root/.ssh/config Host entrance_sshfs Hostname 1.2.3.4
- 再マウント
root@k1script1# mount -a
- IPアドレス更新
- 柏ディスクの再マウント@k1nds2 (主データ保管装置復旧後)
root@k1nds2# mount -a
Trouble shooting/コメント等
- ネットワーク不通中、Slack通知が失敗してGuardian Nodeが止まる
対処療法的にはStop->Execで復帰
- これだと事実上観測継続できないのでネットワークエラーをキャッチするようにコード修正すべき
- 玄関PCは固定IPにすれば作業不要になる
- Web上のスクショを恒久的なサービスにするなら固定IPにしておくべき
- 真空低温関係をローカルネットに移せればk1gateのWAN側をCATVにするなど柏停電中の外部通信を維持できる
- 現状でそれをやると外部通信と引き換えに真空低温の信号がコントロールルームでも読めなくなるので安全管理上不可(?)
- 今回はそもそも干渉計ロックしない状況なので関係なかったが観測中なら主データ装置停止中のSignificant Event 3件を落としていた
- 柏ディスクアンマウント後Hyades-2ディスクをk1nds2にマウントしておくと最低限直近データは読めるので良いかも知れない
- リアルタイムデータが不要な場所で負荷分散を目的にk1nds0, 1の使用を避けているケースがあるがこれらが柏停電中止まっていた
