100% CPU Last

Hilfe zu OTRS Problemen aller Art
Post Reply
Alcest
Znuny newbie
Posts: 5
Joined: 24 Oct 2016, 09:02
Znuny Version: 5.0.10

100% CPU Last

Post by Alcest »

Hallo,

ich habe folgendes Problem.
Unser OTRS hat zu unbestimmten Zeiten eine Last von 100% CPU, dies geht irgendwann so weit das die Maschine nicht mal über vCenter noch reagiert.

Bei top sehe ich folgendes:

top - 11:53:11 up 44 min, 4 users, load average: 7,79, 8,56, 8,37
Tasks: 181 total, 9 running, 171 sleeping, 0 stopped, 1 zombie
%Cpu(s): 99,2 us, 0,7 sy, 0,0 ni, 0,0 id, 0,0 wa, 0,0 hi, 0,1 si, 0,0 st
KiB Mem : 8011220 total, 3498744 free, 2532548 used, 1979928 buff/cache
KiB Swap: 8257532 total, 8257532 free, 0 used. 5217016 avail Mem

PID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND
3295 apache 20 0 651720 215940 6940 R 96,7 2,7 22:00.24 /opt/otrs/bin/c
3119 apache 20 0 558880 126580 6640 R 93,4 1,6 27:44.80 /opt/otrs/bin/c
3304 apache 20 0 651232 215248 6904 R 93,4 2,7 22:02.51 /opt/otrs/bin/c
3155 apache 20 0 552068 124120 6432 R 77,7 1,5 27:13.81 /opt/otrs/bin/c


bei ps sehe ich dann:

apache 3155 1932 61 11:09 ? 00:22:24 /opt/otrs/bin/c -DFOREGROUND

Das sagt mir trotzdem nicht, warum die Last auf 100% ist, kann mich irgendwer aufklären?
HDDs haben Platz, läuft nichts voll.

Habe Hinweise bekommen, dass wenn die Eskalationszeiten berechnet werden es zu diesem Effekt kommen kann.
Zeigt ein sehr ähnliches Verhalten: viewtopic.php?t=28280
Kann mir das irgendwer bestätigen? Ich bin gerade leicht am verzweifeln. ^^

edit:
Läuft auf einem CentOS 7.
Logs von Apache sowie OTRS unauffällig auf Debug Lvl.

edit 2:
Habe noch folgende Fehlermeldung entdeckt:
otrs.Console.pl: Unmatched '<>' in "Nachname1,Vorname1" <Vorname1.Nachname1@Firma1.** at /opt/otrs/Kernel/cpan-lib/Mail/Address.pm line 161.
[Tue May 9 12:13:58 2017] otrs.Console.pl: Unmatched '<>' in "Nachname2,Vorname2" <Vorname2.Nachname2@Firma2.** at /opt/otrs/Kernel/cpan-lib/Mail/Address.pm line 161.

edit 3:
Hab den Server einfach mal laufen lassen in der Hoffnung es regelt sich von selbst.
Verhalten noch immer unverändert.

top - 13:44:08 up 2:35, 4 users, load average: 4,01, 5,33, 5,89
Tasks: 181 total, 7 running, 173 sleeping, 0 stopped, 1 zombie
%Cpu(s): 79,3 us, 0,4 sy, 0,0 ni, 20,0 id, 0,2 wa, 0,0 hi, 0,1 si, 0,0 st
KiB Mem : 8011220 total, 2600184 free, 2349392 used, 3061644 buff/cache
KiB Swap: 8257532 total, 8257532 free, 0 used. 5354668 avail Mem

PID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND
5034 apache 20 0 693536 261348 6480 R 100,0 3,3 54:21.23 /opt/otrs/bin/c
5368 apache 20 0 577712 145456 6480 R 100,0 1,8 27:00.15 /opt/otrs/bin/c
5422 apache 20 0 569944 137800 6496 R 100,0 1,7 26:40.67 /opt/otrs/bin/c

edit 4:
Ich habe jetzt zumindestens den Grund für die Auslastung.
Sobald ein Ticket aufgerufen wird, was den Fehler wie in edit 2 auslöst (öffnen des Tickets dauert circa eine Stunde) kommt es zu der 100% CPU Auslastung, ist das Ticket fertig geladen geht die CPU Last runter.

edit 5:
Hab versucht das ganze Verhalten nochmal zu reproduzieren, leider blieb der Dienst auf 100%.
Erst ein neustart des Apache hat geholfen.


Hat wer eine Ahnung was ich machen kann?


Vielen Dank im Voraus.
Post Reply