返回列表 發帖

ATCOM IP01,我的IP-01突然经常死机,可能在reboot中

本帖最後由 角色 於 2010-8-25 08:01 編輯

因为ATCOM 经常死机,这个帖子是用来记录最长的run-time是多少? 如果你天天关机,当然你的记录就没有意思了。

Members们,把你们的最长的runtime,上载,看看那一台IP-01能够走的最远。



角色

呵呵 ,看了一下,看来ip01工作稳定性稍差一点

TOP

等你的OpenVPN报告。

角色

TOP

我和bubblestar兄做了一些试验,让大家分享。

1)深圳IP-01与香港IP-01接:每次讲不久后,语音就变得不清 ...
角色 發表於 2010-9-2 13:17



    心动中,不久的将来 我也要准备用atom板装asterisk  我的openvpn也学得差不多了

TOP

我和bubblestar兄做了一些试验,让大家分享。

1)深圳IP-01与香港IP-01接:每次讲不久后,语音就变得不清晰。

2)深圳IP-01与香港SPA942(对立iptel account):我用IP-01的iptel trunk给香港的spa942打过去,说了不久候,语音就开始不好。

3)香港QNAP NAS Asterisk与香港SPA942(对立iptel account):聊了很久也没有问题。

4)深圳 Intel D510M Asterisk Server与香港IP-01对接:通话很久都没有发现问题,还有话音非常清晰。

结论:不知道我的IP-01是否出问题?又或者我与外面接很多Trunks,IP-01CPU和RAM都不能应付,所以出现packets drop的现象。

IP-01本身设计是Internal IP-PBX,而不是接外面的线的。如果要打电话,要通过FXO接中国电信的PSTN。

角色

TOP

Once every 2 weeks!!

No wonder my IP01 stop letting me access its GUI even it was still running when I hit the record  of 14 days in our last experiment.

TOP

YH,

I got this explanation for your problem from other forum.

I often see asterisk crash on the blackfin (about once every 2 weeks), but instead of rebooting the system every evening in SwitchFin we have added procwatch this will restart the system automatically if it detects a crash, but also scrubs the memory when it gets to low (which i think is the main reason for asterisk crashing).

TOP

這不是辦法,會做成唔少reboot 和downtime。

TOP

If the IP-01 is connected internally without touching Internet, I believe that the asterisk process becomes more stable. I do not where gives the asterisk failures, either from IP-01 itself or from other parties from Internet. Now I modified the IsAsteriskAlive.sh script such that when asterisk processes are gone, the system will not reboot or start the asterisk immediately and wait for 5 minutes. Afterwards the system will start the asterisk again. The purpose of the 5-min waiting is used for the system to have time to clear up other taskes or the external parties stop accessing the system in order to make the CPU loading reduce to a minimal level, e.g. less 0.2.

I hope this new measure will improve the asterisk stability. I shall let you know the test results after several days evaluation.

YH

TOP

本帖最後由 ckleea 於 2010-8-27 08:04 編輯

My switchfin has working for Uptime : 06:46:29 up 8 days, 9:16, load average: 3.72, 3.20, 3.05
The CPU utilization has returned to normal 4%

TOP

从上一楼的信息,在很多期间,IP-01 rebooted好几次,为什么呢?从有问题的时候的CPU loading来看,asterisk process站了很大的部分,估计它要处理一些“事”,是什么事呢?从我关电源好几次都不能成功,最后把modem关了才能把问题解决。这说明什么呢?就是IP-01处理外部问题能力不足,还有系统可能需要些如NAND flash很多,一时之间CPU都应付不来,那么uClinux系统唯有把把asterisk关掉,但是系统又会重新reboot。系统重启后,由于外来的信息又来,那么系统又再次出现之前的问题,asterisk被kill,然后再次reboot。

现在我的部署:

1)现在我已经把logger全关闭,以腾出CPU time来处理从Internet过来的事情。

2)如果再出现问题,可能要写一段program,就是看看CPU loading是否将到0.2以下,才启动asterisk,而不是reboot。

角色

TOP

本帖最後由 角色 於 2010-8-24 23:17 編輯

本来每天reboot,应该没有问题。但是今天却经常reboot就出问题了。然后我用putty 进去看,发现CPU loading非常大(用command top)

正常的CPU loading是非常低,如下:
  1. Mem: 35032K used, 10672K free, 0K shrd, 164K buff, 1068K cached
  2. Load average: 0.02 0.08 0.12
  3.   PID USER     STATUS   VSZ  PPID %CPU %MEM COMMAND
  4. 2256 root     R        976   353  6.4  2.1 busybox
  5.   328 root     S      18452   166  0.0 40.3 asterisk
  6.   150 root     S      18452     1  0.0 40.3 asterisk
  7.   292 root     S      18452   166  0.0 40.3 asterisk
  8.   166 root     S      18452   150  0.0 40.3 asterisk
  9.   177 root     S      18452   166  0.0 40.3 asterisk
  10.   182 root     S      18452   166  0.0 40.3 asterisk
  11.   179 root     S      18452   166  0.0 40.3 asterisk
  12.   284 root     S      18452   166  0.0 40.3 asterisk
  13.   291 root     S      18452   166  0.0 40.3 asterisk
  14.   320 root     S      18452   166  0.0 40.3 asterisk
  15. 1089 root     S      18452   166  0.0 40.3 asterisk
  16.   285 root     S      18452   166  0.0 40.3 asterisk
  17.   283 root     S      18452   166  0.0 40.3 asterisk
  18.   173 root     S      18452   166  0.0 40.3 asterisk
  19.   287 root     S      18452   166  0.0 40.3 asterisk
  20.   281 root     S      18452   166  0.0 40.3 asterisk
  21.   282 root     S      18452   166  0.0 40.3 asterisk
  22.   203 root     S      18452   166  0.0 40.3 asterisk
  23.   288 root     S      18452   166  0.0 40.3 asterisk
  24.   229 root     S      18452   166  0.0 40.3 asterisk
複製代碼
然后我再看Dielog,发现中间经常reboot。
  1. root:/persistent/etc> cat /persistent/DieLog
  2. Asterisk is rebooted at Wed Aug 18 20:00:11 UTC 2010
  3. Asterisk is rebooted at Thu Aug 19 20:00:18 UTC 2010
  4. Asterisk is rebooted at Fri Aug 20 20:00:17 UTC 2010
  5. Asterisk is rebooted at Sat Aug 21 20:00:16 UTC 2010
  6. Asterisk is rebooted at Sun Aug 22 20:00:13 UTC 2010
  7. Asterisk is rebooted at Mon Aug 23 20:00:11 UTC 2010
  8. Asterisk die at Tue Aug 24 11:51:28 UTC 2010
  9. Asterisk die at Tue Aug 24 11:56:41 UTC 2010
  10. Asterisk die at Tue Aug 24 12:04:53 UTC 2010
  11. Asterisk die at Tue Aug 24 12:38:31 UTC 2010
  12. Asterisk die at Tue Aug 24 12:50:48 UTC 2010
  13. Asterisk die at Mon Jan  1 00:04:21 UTC 2007
  14. Asterisk die at Tue Aug 24 13:38:03 UTC 2010
  15. Asterisk die at Tue Aug 24 13:43:17 UTC 2010
複製代碼
我关了好几次都不行,那么我怀疑IP-01给外间攻击,所以我把modem关掉,然后再观察CPU loading,发现慢慢好了,那么我的估计可能是对。把Modem关了,外面的人想搞也搞不到,然后自自然就离开(这是我的估计)。所以下次你的IP-01有问题,你可以先关一下modem看看。

如果不是这样,可以用serial cable接IP-01的serial port,而把lan线拔走。用serial console去观测,看看是否CPU能在正常的水平。



角色

TOP

每天都reboot一次,中间连Kernel都死掉!连putty都不能进入,所以关电源,然后reboot。

如果是这样,唯一就是外面有一个timer才可以。


角色

TOP

我的一直都没有什么问题了,因为每天都reboot!不知道大家的IP-01怎样呢?

角色

TOP

现在用了自动每一个凌晨reboot货,看起来没有其他的大问题。

角色

TOP

返回列表