Differences between revisions 2 and 28 (spanning 26 versions)
Revision 2 as of 2013-06-07 13:09:22
Size: 1978
Comment:
Revision 28 as of 2013-06-17 15:19:29
Size: 9842
Comment:
Deletions are marked like this. Additions are marked like this.
Line 1: Line 1:
= Check list for Real Time syste = = Check list for real time system =
Line 3: Line 3:
Real time systemを動かすために、どのようなモジュール、サービス、ソフトなどが必要かは[[KAGRA/Subgroups/DGS/manual/SysAdmin|ここ]]に書いてある。

-----
Line 5: Line 8:
 1. medmに数字が出て、その数時が変化しているか? [[How to check]] [[#medm|If no-> medm trouble]]
 * dataviewerで現在、及び過去のデータが見えるか?[[#dv|No-> dataviewer trouble]]
 * diaggui(DTT)で現在、及び過去のデータが見えるか?[[#dtt|No-> diaggui trouble]]
 1. medmに数字が出て、その数字が変化しているか? [[KAGRA/Subgroups/DGS/Manual/MEDM|[How to check] ]]
  * 症状: 数字が出ない
   * 原因: epics IOCが立ち上がっていない。 [[#epics|[解決策] ]]
   * 原因: mbufが走っていないためepics IOCが起動できない。 [[#modules|[解決策] ]]
   * 原因: caRepeaterが起動していない。 [[#epics|[解決策] ]]
  * 症状: 数字が出ても0のまま動かない
   * 原因: burtが0のままである。[[#burt|[解決策] ]]
   * 原因: real time moduleが走っていない。 [[#modules|[解決策] ]]
  * 症状: 数字が出て、0以外の数が表示されているが、数字が動かない
   * 原因: 最初のADCにtiming信号が入っていない -> 65536Hz, 0-5V square wavesがADCにきちんと入力されているかチェック。
 * dataviewerで現在、及び過去のデータが見えるか? [[KAGRA/Subgroups/DGS/Manual/DataViewer|[How to check] ]]
  * 症状: channel名が出てこない:
   * 原因: awgtpmanが走っていない。[[#awg|[解決策] ]]
   * 原因: daqdが動いていない。[[#daqd|[解決策] ]]
  * 症状: 現在のデータも過去のデータも見えない:
   * 原因: ndsが動いていない。[[#nds|[解決策] ]]
  * 症状: 現在のデータは見えるが、過去のデータが見えない:
   * 原因: daqdが動いていない。[[#daqd|[解決策] ]]
  * 症状: 過去のデータは見えるが、現在のデータが見えない:
   * 原因: DAQ networkのどこかが切れている。
  * 症状: データは見えるが、数十秒で止まる。
   * 原因: daqdが動いていない。[[#daqd|[解決策] ]]
   * 原因: storageにうまく書き込めない。 [[#frames|[解決策] ]]
  * 症状: diagguiではデータが見えるのに、dataviewerでは{{{
Error in obtaining chan info.
Connecting....connect(); errno=111
}}}というメッセージが出て、channel名が出てこない:
   * 原因: dataviewerのバージョンがRTSのバージョンに比べて古い、もしくはLinuxのカーネルとバージョンがあっていない->RTSのバージョンに一致したdataviewerをビルドしてインストールする。[[KAGRA/Subgroups/DGS/RTPC/WS#dv|[How to install] ]]
Line 9: Line 37:
 * ezcaコマンド群は問題なく動くか? [[How to check]]
 * BURTは裏できちんと動いていて、epicsの変化を記録しているか? [[How to check]]
 * Conlogは作動しているか? [[How to check]]
Line 13: Line 38:
=== Model developing test ===  * diaggui(DTT)で現在、及び過去のデータが見えるか? [[KAGRA/Subgroups/DGS/Manual/Diaggui|[How to check] ]]
  * 症状: channel名が出てこない:
   * 原因: awgtpmanが走っていない。[[#awg|[解決策] ]]
   * 原因: daqdが動いていない。[[#daqd|[解決策] ]]
  * 症状: synchronization errorがでる:
   * 原因: real time PCの計算機自身の時間と、real time software上の時間がずれてしまっている。->real time PCを再起動。
  * 症状: time outになってしまう:
   * 原因: real time PCとdiagguiを走らせているclient PCの内部時間がずれている。->client PCのntpが動いていているか確認。時刻を合わせる。
  * 症状: 現在のデータも過去のデータも見えない:
   * 原因: ndsが動いていない。[[#nds|[解決策] ]]
  * 症状: 現在のデータは見えるが、過去のデータが見えない:
   * 原因: daqdが動いていない。[[#daqd|[解決策] ]]
  * 症状: 過去のデータは見えるが、現在のデータが見えない:
   * 原因: DAQ networkのどこかが切れている。

----
=== 上記項目がおかしい場合、まず試すこと ===
<<Anchor(modules)>>
 1. mbuf及び、real time moduleは動いているか? {{{
controls@standalone ~ $ lsmod
Module Size Used by
k1vex 9455730 0
k1x01 9198550 1 k1vex
mbuf 7317 10 k1vex,k1x01
}}}とmbufが動いていて、モジュールとしてIOCとreal time model(ここでは一例としてk1vex及びk1x01)が走っているか?

  * mbufは/etc/rc.localから呼び出されている。
  * RT model等は/opt/rtcds/kamioka/k1/scripts/startk1vex等から呼び出されている(startスクリプトの[[KAGRA/Subgroups/DGS/Manual/CheckList/StartScript|一例]])。これをたどっていくと、何が起動されているかが分かる。[[KAGRA/Subgroups/DGS/manual/SysAdmin|ここ]]も参照するといい。
   * /opt/rtcds/kamioka/k1/target/k1vex/scripts/startupK1rtを見ると、insmodコマンドでRT modelをLinuxカーネルのmoduleとして起動していることが分かる。ログが/opt/rtcds/kamioka/k1/target/k1vex/logs/log.txtに書かれているので、見る。
   * 起動できない原因の一つが、現在走っているlinuxカーネルと違うバージョンのカーネルの元でbuildされた可能性がある。その場合現在走っているカーネルで[[KAGRA/Subgroups/DGS/Manual/BuildModel|再ビルド]]しなくてはならない。
   * 現在のカーネルのバージョンはuname -aで分かる。

<<Anchor(epics)>>
 * epics caRepeater及びepics IOCが走っているか? {{{
controls@standalone ~ $ ps -ef | grep epics
controls 5045 1 0 14:38 ? 00:00:00 /opt/rtapps/epics/base/bin/linux-x86_64/caRepeater
controls 5085 1 0 14:38 ? 00:00:01 ./k1x01epics k1x01epicsK1.cmd
controls 5189 1 4 14:38 ? 00:00:10 ./k1vexepics k1vexepicsK1.cmd
}}}
  * caRepeaterは/etc/rc.localから呼び出されている。
  * それぞれのモデルのepics IOCは、それぞれのモデルのstartスクリプトから起動されている。
  * log(example): [[KAGRA/Subgroups/DGS/Manual/CheckList/epicsLog|/opt/rtcds/kamioka/k1/target/k1vex/k1vexepics/iocK1.log]]

<<Anchor(burt)>>
 * burtは1になっているか?
  * medmで/opt/rtcds/kamioka/k1/medm/k1x01/K1X01_GDS_TP.adlや/opt/rtcds/kamioka/k1/medm/k1vex/K1VEX_GDS_TP.adlを開いて「BURT」のところが緑になっているか確認する。

<<Anchor(WatchDog)>>
 * WatchdogがOFFになっていないか?
  * /opt/rtcds/kamioka/k1/medm/k1vex/K1VIS_ETMX_F0.adlを開いて、右下のWatchdogがONになっていることを確認。
 
<<Anchor(awg)>>
 * awgtpmanは走っているか? {{{

controls@standalone ~ $ ps -ef | grep awg
root 5159 1 0 14:38 ? 00:00:12 /opt/rtcds/kamioka/k1/target/gds/bin/awgtpman -s k1x01 -4 -l /opt/rtcds/kamioka/k1/target/gds/awgtpman_logs/k1x01.log
root 5280 1 0 14:39 ? 00:00:12 /opt/rtcds/kamioka/k1/target/gds/bin/awgtpman -s k1vex -l /opt/rtcds/kamioka/k1/target/gds/awgtpman_logs/k1vex.log
}}}
  * それぞれのモデルのawgtpmanは、それぞれのモデルのstartスクリプトから起動されている。
  * log: [[KAGRA/Subgroups/DGS/Manual/CheckList/awgtpmanLog|/opt/rtcds/kamioka/k1/target/gds/awgtpman_logs/k1vex.log]]

<<Anchor(nds)>>
 * ndsは走っているか? {{{
controls@standalone ~ $ ps -ef | grep nds
controls 5534 1 0 14:39 ? 00:00:00 su controls -c /opt/rtcds/kamioka/k1/target/fb/nds /opt/rtcds/kamioka/k1/target/fb/pipe
controls 5539 5534 0 14:39 ? 00:00:00 /opt/rtcds/kamioka/k1/target/fb/nds /opt/rtcds/kamioka/k1/target/fb/pipe
}}}
  * ndsは/etc/inittabから呼び出されている {{{
controls@standalone ~ $ tail -n 2 /etc/inittab
fb:2345:respawn:/opt/rtcds/kamioka/k1/target/fb/start_daqd.inittab
nds:2345:respawn:/opt/rtcds/kamioka/k1/target/fb/start_nds.inittab
}}}

  * log: /opt/rtcds/kamioka/k1/target/fb/logs/nds.log (通常問題なく起動するとログには何も記述されない)

<<Anchor(daqd)>>
 * daqdは走っているか? {{{
controls@standalone ~ $ ps -ef | grep daqd
controls 20077 1 0 16:42 ? 00:00:00 su controls -c /opt/rtcds/kamioka/k1/target/fb/daqd -c /opt/rtcds/kamioka/k1/target/fb/daqdrc
controls 20081 20077 3 16:42 ? 00:00:00 /opt/rtcds/kamioka/k1/target/fb/daqd -c /opt/rtcds/kamioka/k1/target/fb/daqdrc
}}}
  * daqdは/etc/inittabから呼び出されている {{{
controls@standalone ~ $ tail -n 2 /etc/inittab
fb:2345:respawn:/opt/rtcds/kamioka/k1/target/fb/start_daqd.inittab
nds:2345:respawn:/opt/rtcds/kamioka/k1/target/fb/start_nds.inittab
}}}

  * log: [[KAGRA/Subgroups/DGS/Manual/CheckList/daqdLog|/opt/rtcds/kamioka/k1/target/fb/logs/daqd.log]]
  * daqdが走っているかどうかの確認方法の一つは/frames以下にfame dataが書き込まれているかどうかを見ることである。

<<Anchor(frames)>>
 * /frames以下にきちんと書き込めているか?
  * dfコマンドで/dev/sdc1の空き容量をチェック。
  * /dev/sdc1があるかチェック。3台目のHDDがsdcとなるので、2台目を抜いてきどうしたりすると本来sdcになるものがsdbになってしまったりすることがある。
  */frame/full/XXXX/以下にファイルが随時書き込まれていくか確認してみる。
----
== More check list ==

 * ezcaコマンド群は問題なく動くか?
 * BURTは裏できちんと動いていて、epicsの変化を記録しているか?
 * Conlogは作動しているか?
 * CPU meterの値は十分小さいか?

----
== Model building test ==
Line 19: Line 148:
-----
= Troubles =
<<Anchor(medm)>>
== MEDM ==
----
== 動作の挙動がおかしい ==
Line 24: Line 151:
 * [[#medm_NoNumber|medmのスクリーンに数字が出ていない。]]
 * [[#medm_all0|medmのスクリーンに数字は出ているが0のまま動かない。]]

<<Anchor(dv)>>
== dataviewer ==
  * dataviewerでリアルタイムデータが見えない。
  * dataviewerで過去のデータが見えない。

<<Anchor(dtt)>>
== diaggui ==
  * diagguiでリアルタイムデータが見えない。
  * diagguiで過去のデータが見えない。



----
= Trouble shooting =
== medm ==
<<Anchor(medm_NoNumber)>>
 * スクリーンに数字が出ていない。
  * Gentoo上で{{{
$ ps -ef | grep epics
}}}で確認、正しい場合は{{{
controls 5021 1 0 Jun06 ? 00:00:00 /opt/rtapps/epics/base/bin/linux-x86_64/caRepeater
controls 5063 1 1 Jun06 ? 00:16:01 ./k1x01epics k1x01epicsK1.cmd
controls 5270 1 5 Jun06 ? 00:57:51 ./k1vexepics k1vexepicsK1.cmd
controls 28687 5081 0 12:17 pts/0 00:00:00 grep --colour=auto epics
}}}のように表示される。epicsが動いていない場合、

== dataviewer
 * /frames以下にfame dataが書き込まれているか?
 * RTSの動作が重い、medmの各K1XXX_GDS_TP.adlの「CYC/USR」の左の数字が黄色または赤になっている:
  * 原因: データ保存用HDDがいっぱいになっている。 [[#frames|[解決策] ]]

Check list for real time system

Real time systemを動かすために、どのようなモジュール、サービス、ソフトなどが必要かはここに書いてある。


Simple check list

  1. medmに数字が出て、その数字が変化しているか? [How to check]

    • 症状: 数字が出ない
      • 原因: epics IOCが立ち上がっていない。 [解決策]

      • 原因: mbufが走っていないためepics IOCが起動できない。 [解決策]

      • 原因: caRepeaterが起動していない。 [解決策]

    • 症状: 数字が出ても0のまま動かない
      • 原因: burtが0のままである。[解決策]

      • 原因: real time moduleが走っていない。 [解決策]

    • 症状: 数字が出て、0以外の数が表示されているが、数字が動かない
      • 原因: 最初のADCにtiming信号が入っていない -> 65536Hz, 0-5V square wavesがADCにきちんと入力されているかチェック。

  2. dataviewerで現在、及び過去のデータが見えるか? [How to check]

    • 症状: channel名が出てこない:
    • 症状: 現在のデータも過去のデータも見えない:
    • 症状: 現在のデータは見えるが、過去のデータが見えない:
    • 症状: 過去のデータは見えるが、現在のデータが見えない:
      • 原因: DAQ networkのどこかが切れている。
    • 症状: データは見えるが、数十秒で止まる。
    • 症状: diagguiではデータが見えるのに、dataviewerでは

      Error in obtaining chan info.
      Connecting....connect(); errno=111
      というメッセージが出て、channel名が出てこない:
      • 原因: dataviewerのバージョンがRTSのバージョンに比べて古い、もしくはLinuxのカーネルとバージョンがあっていない->RTSのバージョンに一致したdataviewerをビルドしてインストールする。[How to install]

  3. diaggui(DTT)で現在、及び過去のデータが見えるか? [How to check]

    • 症状: channel名が出てこない:
    • 症状: synchronization errorがでる:
      • 原因: real time PCの計算機自身の時間と、real time software上の時間がずれてしまっている。->real time PCを再起動。

    • 症状: time outになってしまう:
      • 原因: real time PCとdiagguiを走らせているclient PCの内部時間がずれている。->client PCのntpが動いていているか確認。時刻を合わせる。

    • 症状: 現在のデータも過去のデータも見えない:
    • 症状: 現在のデータは見えるが、過去のデータが見えない:
    • 症状: 過去のデータは見えるが、現在のデータが見えない:
      • 原因: DAQ networkのどこかが切れている。


上記項目がおかしい場合、まず試すこと

  1. mbuf及び、real time moduleは動いているか?

    controls@standalone ~ $ lsmod
    Module                  Size  Used by
    k1vex                9455730  0
    k1x01                9198550  1 k1vex
    mbuf                    7317  10 k1vex,k1x01
    とmbufが動いていて、モジュールとしてIOCとreal time model(ここでは一例としてk1vex及びk1x01)が走っているか?
    • mbufは/etc/rc.localから呼び出されている。
    • RT model等は/opt/rtcds/kamioka/k1/scripts/startk1vex等から呼び出されている(startスクリプトの一例)。これをたどっていくと、何が起動されているかが分かる。ここも参照するといい。

      • /opt/rtcds/kamioka/k1/target/k1vex/scripts/startupK1rtを見ると、insmodコマンドでRT modelをLinuxカーネルのmoduleとして起動していることが分かる。ログが/opt/rtcds/kamioka/k1/target/k1vex/logs/log.txtに書かれているので、見る。
      • 起動できない原因の一つが、現在走っているlinuxカーネルと違うバージョンのカーネルの元でbuildされた可能性がある。その場合現在走っているカーネルで再ビルドしなくてはならない。

      • 現在のカーネルのバージョンはuname -aで分かる。

  • epics caRepeater及びepics IOCが走っているか?

    controls@standalone ~ $ ps -ef | grep epics
    controls  5045     1  0 14:38 ?        00:00:00 /opt/rtapps/epics/base/bin/linux-x86_64/caRepeater
    controls  5085     1  0 14:38 ?        00:00:01 ./k1x01epics k1x01epicsK1.cmd
    controls  5189     1  4 14:38 ?        00:00:10 ./k1vexepics k1vexepicsK1.cmd

  • burtは1になっているか?
    • medmで/opt/rtcds/kamioka/k1/medm/k1x01/K1X01_GDS_TP.adlや/opt/rtcds/kamioka/k1/medm/k1vex/K1VEX_GDS_TP.adlを開いて「BURT」のところが緑になっているか確認する。

  • WatchdogがOFFになっていないか?
    • /opt/rtcds/kamioka/k1/medm/k1vex/K1VIS_ETMX_F0.adlを開いて、右下のWatchdogがONになっていることを確認。

  • awgtpmanは走っているか?

    controls@standalone ~ $ ps -ef | grep awg
    root      5159     1  0 14:38 ?        00:00:12 /opt/rtcds/kamioka/k1/target/gds/bin/awgtpman -s k1x01 -4 -l /opt/rtcds/kamioka/k1/target/gds/awgtpman_logs/k1x01.log
    root      5280     1  0 14:39 ?        00:00:12 /opt/rtcds/kamioka/k1/target/gds/bin/awgtpman -s k1vex -l /opt/rtcds/kamioka/k1/target/gds/awgtpman_logs/k1vex.log

  • ndsは走っているか?

    controls@standalone ~ $ ps -ef | grep nds
    controls  5534     1  0 14:39 ?        00:00:00 su controls -c /opt/rtcds/kamioka/k1/target/fb/nds /opt/rtcds/kamioka/k1/target/fb/pipe
    controls  5539  5534  0 14:39 ?        00:00:00 /opt/rtcds/kamioka/k1/target/fb/nds /opt/rtcds/kamioka/k1/target/fb/pipe
    • ndsは/etc/inittabから呼び出されている

      controls@standalone ~ $ tail -n 2 /etc/inittab
      fb:2345:respawn:/opt/rtcds/kamioka/k1/target/fb/start_daqd.inittab
      nds:2345:respawn:/opt/rtcds/kamioka/k1/target/fb/start_nds.inittab
    • log: /opt/rtcds/kamioka/k1/target/fb/logs/nds.log (通常問題なく起動するとログには何も記述されない)

  • daqdは走っているか?

    controls@standalone ~ $ ps -ef | grep daqd
    controls 20077     1  0 16:42 ?        00:00:00 su controls -c /opt/rtcds/kamioka/k1/target/fb/daqd -c /opt/rtcds/kamioka/k1/target/fb/daqdrc
    controls 20081 20077  3 16:42 ?        00:00:00 /opt/rtcds/kamioka/k1/target/fb/daqd -c /opt/rtcds/kamioka/k1/target/fb/daqdrc
    • daqdは/etc/inittabから呼び出されている

      controls@standalone ~ $ tail -n 2 /etc/inittab
      fb:2345:respawn:/opt/rtcds/kamioka/k1/target/fb/start_daqd.inittab
      nds:2345:respawn:/opt/rtcds/kamioka/k1/target/fb/start_nds.inittab
    • log: /opt/rtcds/kamioka/k1/target/fb/logs/daqd.log

    • daqdが走っているかどうかの確認方法の一つは/frames以下にfame dataが書き込まれているかどうかを見ることである。

  • /frames以下にきちんと書き込めているか?
    • dfコマンドで/dev/sdc1の空き容量をチェック。
    • /dev/sdc1があるかチェック。3台目のHDDがsdcとなるので、2台目を抜いてきどうしたりすると本来sdcになるものがsdbになってしまったりすることがある。
    • /frame/full/XXXX/以下にファイルが随時書き込まれていくか確認してみる。


More check list

  • ezcaコマンド群は問題なく動くか?
  • BURTは裏できちんと動いていて、epicsの変化を記録しているか?
  • Conlogは作動しているか?
  • CPU meterの値は十分小さいか?


Model building test

  1. Client Workstation上でMatlabが立ち上がるか?
  2. modelをbuildできるか?
  3. 再起動で問題なく動くか?


動作の挙動がおかしい

  • RTSの動作が重い、medmの各K1XXX_GDS_TP.adlの「CYC/USR」の左の数字が黄色または赤になっている:
    • 原因: データ保存用HDDがいっぱいになっている。 [解決策]

KAGRA/Subgroups/DGS/Manual/CheckList (last edited 2016-11-14 14:38:02 by TakahiroYamamoto)