cancel
Showing results for 
Search instead for 
Did you mean: 

Frage an die Community, wie geht ihr mit abgebrochenen Schedulers vor?

RobertRoginer
Level 6
Hallo zusammen, ich wollte mal Fragen wie ihr mit abgerbochenen Schedulers umgeht.

Wir Windows 10 Runtime Resourcen (RR), die einmal in der Nacht durchstarten, falls irgendwas hängen sollte.
Ein Scheduler ist bei uns in 3 Taks aufgebaut (Windows Login, Prozess, Logout).

Im Login haben wir eingestellt, dass falls eine Exception kommt, ein Logout durchgeführt werden soll:
5210.png
Beim Prozess das gleiche:
5211.png
Beim Logout haben wir das eingestellt:
5212.png
Wir haben Prozesse die Nachts laufen, oder auch am Wochenende. Und manchmal bricht der Login Prozess ab oder auch der Logout Prozess.

Die Maschine hängt daraufhin, weil manchmal kein richtiger Logout durchgeführt wurde.

Um das zu verhindern habe ich mir gedacht, ich schreibe einfach einen Neustart Prozess (CMD- Befehl) der im Falle eines Abbruches durchgeführt wird und der Prozess soll nochmal neu starten.

Wie geht ihr denn damit um?

------------------------------
Robert Roginer
RPA Modeller
Mainova
Europe/Berlin
------------------------------
5 REPLIES 5

Walter.Koller
Level 11
Hallo,

Wir haben unsere Schedules ähnlich aufgebaut:
1. login
2. Prozess(e) starten
3. logout
Manchmal kommt vor dem ersten Login auch noch ein Logout, nur um sicher zu gehen dass die Prozesse mit dem richtigen User ausgeführt werden.
Einmal am Tag in der Nacht gibt es einen Restart.

Für Resources immer Online sein müssen (zB um web service requests entgegen zu nehmen) wird in der Früh ein login gemacht und am Abend ein logout bzw gleich ein restart.

Probleme mit Login oder Logout hatte wir in den letzten Jahren nie. Abgesehen von sehr seltenen Fällen in denen der Login auf pending bleibt. 

Was passiert wenn der Login / Logout Prozess abbricht?
Werden die Prozesse überhaupt gestartet oder gibt es ein resource unavailable Problem?

lg

------------------------------
Walter Koller
Solution Manager
Erste Group IT International GmbH
Europe/Vienna
------------------------------

Hallo,

ich gebe zu, die Entwickler haben bisher nur im Control Room nachgeschaut. Eine richtige Fehlermeldung kommt meistens nie. 
Hier in dem Beispiel hat das Logout zu einem Problem geführt, aber man erkennt zum Beispiel keine Fehlermeldung:

5145.png
Ok, ich habe ein Beispiel gefunden:
5146.png
In dem oberen Screenshot sieht man, das am 10.05.2022 um 4 Uhr ein Prozess gestartet wurde, ein Login Prozess, aber interessanterweise wurde der nachfolgende eigentliche Prozess nicht gestartet. (Jetzt ist natürlich die Frage wieso nicht). Unsere Vermutung war, das beim Login versuch, Windows länger gebraucht hat beim einloggen, aber beweisen können wir es nicht,. Trotzdem glauben wir, dass jetzt ein nachfolgender Prozess mit terminatet gelistet werden müsste. Das ist aber nicht passiert.
Denn man sieht die Maschine blieb eingeloggt und um 5:30 startete der nächste Prozess, der kam mit einem Fehler, dass die Maschine noch nicht ausgeloggt ist.
5147.png
Der Logout wurde auch terminated, aber die Fehlermeldung wird nicht angezeigt, man sieht quasi nicht woran es lag:
5148.pngMeine Frage auch, weil du jetzt meintest "resource unavailable Problem", wo könnte ich das erkennen/sehen?

------------------------------
Robert Roginer
RPA Modeller
Mainova
Europe/Berlin
------------------------------

Ein Logout mit Status terminated aber keine Fehlermeldung?! 
Wie gesagt, wir haben eigentlich keine Probleme mit dem Login/Logout deshalb kann ich dazu leider nichts sagen.
Vielleicht sagt das Windows Event Log mehr dazu.
Interessant wäre ob der Logout Prozess einen Screenshot machen kann. 

Wenn Tasks zu schnell hintereinander geplant wurden kann es passieren dass der nächste Task nicht gestartet wird. Das sieht man leider nicht in der normalen Übersicht. Diese Prozesse fehlen dort einfach. Nachdem der Prozess nicht gestartet wurde kann er auch nicht terminieren. 
Ich habe vor meiner ersten Antwort schon auf die Post Completion Delays geschaut da ich etwas in diese Richtung vermutet habe. Welcher Wert am Besten ist hängt ganz von eurer Umgebung ab. Bei uns dauert ein Login eine kleine Ewigkeit und wir haben deshalb 180 Sekunden stehen. 
Bei Logout haben wir geringere Werte aber wenn das der letzte Task im Schedule ist reicht 0 auch. Manche unserer Schedule fingen mit einem Logout an, da haben wir natürlich eine Delay. 
In unserer Umgebung gibt es noch eine zusätzliche Verzögerung nachdem die Resource schon als Connected angezeigt wird. Man muss noch eine Minute warten bis die Resource auch Prozesse akzeptiert. Das ist aber vielleicht nur in unserer Umgebung so.

Versäumte Tasks oder ganze Schedule die nicht gelaufen sind kann man hier finden:
5160.png
Rechts in der Übersicht in Recent Activity gibt es Links: "View Logs" 

Ich habe einen ähnlichen Fall gefunden. So sehen die Logs aus:
5161.png

Step 6 Logout, wurde gestartet
Step 7 Login, konnte erst gar nicht gestartet werden da "resource... is too busy"
In der normalen Übersicht in Today würde man nur Step 6 sehen, Step 7 aber nicht.

Wann und wie oft der Scheduler versuchen soll einen Task zu starten kann man im System tab, unter System / Scheduler einstellen.
Das würde vielleicht bei den nicht gestarteten Tasks helfen, nicht aber bei den terminated Logout.


------------------------------
Walter Koller
Solution Manager
Erste Group IT International GmbH
Europe/Vienna
------------------------------

Hallo,

ja ich habe letztens einen Test gemacht und das Post Relay auf 0 gesetzt gehabt, und habe mich gewundert, dass der Prozess trotzdem sauber ausgeführt wurde. Jetzt wo ich sehe das Standardmäßig unter Systems-->Scheduler das so eingestellt ist, wundert mich das nicht:
5177.png
Das mit dem Recent Activity ist auch interessant, kannte ich vorher auch so nicht, hier ist zumindest auch Prozess bei uns heute terminated:
5178.png
Habe dann Testweise mich auf die Maschine eingeloggt und unter dem Event Viewer nach Fehler geschaut, aber leider sind die Informationen auch nicht unbedingt hilfreich hier:
5179.png
5180.png
Ich weiß das man das Log Level von Blue Prism höher stellen kann, ob das dann mehr Informationen gibt, oder den Grund, das muss man mal testen.

Aber ich bedanke mich trotzdem bei dir für die nützlichen Informationen 🙂

------------------------------
Robert Roginer
RPA Modeller
Mainova
Europe/Berlin
------------------------------

In solchen Fällen werden die Blue Prism logs alleine nicht ausreichen.
Am Besten in diesen drei Logs nachsehen ob etwas auffälliges dabei ist.

5196.png

------------------------------
Walter Koller
Solution Manager
Erste Digital / Erste Group Bank
Europe/Vienna
------------------------------