Grid Control und die Sommerzeit
Verfasst von Tenebrias am 30.03.2009 - 08:04
Wie bereits befürchtet, hat uns die Zeitumstellung am gestrigen Sonntag bei Grid Control Probleme bereitet. Ganz knapp: Nahezu alle unsere Datenbanken hatten den Status Pending und konnten nicht mehr überwacht werden.
Stoppen und Starten des Agenten via emctl ist genausowenig hilfreich wie die Erneuerung der Grid Control Konfiguration.
Das Internet brachte einmal mehr die Lösung:
1. Stoppen des Agenten
oraadmin@deerlf0vl1 [AGENT] /opt/oracle/oraadmin/admin/AGENT > emctl stop agent Oracle Enterprise Manager 10g Release 4 Grid Control 10.2.0.4.0. Copyright (c) 1996, 2007 Oracle Corporation. All rights reserved. Stopping agent ... stopped.
2. Zurücksetzen der Zeitzone
oraadmin@deerlf0vl1 [AGENT] /opt/oracle/oraadmin/admin/AGENT > emctl resetTZ agent Oracle Enterprise Manager 10g Release 4 Grid Control 10.2.0.4.0. Copyright (c) 1996, 2007 Oracle Corporation. All rights reserved. Updating /opt/oracle/oraadmin/product/10.2.0.4/initial/agent10g//sysman/config/emd.properties... Successfully updated /opt/oracle/oraadmin/product/10.2.0.4/initial/agent10g//sysman/config/emd.properties. Login as the em repository user and run the script: exec mgmt_target.set_agent_tzrgn('deerlf0vl1.erlf.siemens.de:3872','Europe/Berlin') and commit the changes This can be done for example by logging into sqlplus and doing SQL> exec mgmt_target.set_agent_tzrgn('deerlf0vl1.erlf.siemens.de:3872','Europe/Berlin') SQL> commit
3. Verbindung mit sqlplus wie gefordert
SQL> exec mgmt_target.set_agent_tzrgn('deerlf0vl1.erlf.siemens.de:3872','Europe/Berlin')
SQL> commit;
4. Agent neu starten
emctl start agent
Et voila .. unser Ziel schaltet in der Ansicht von Grid Control wieder auf verfügbar um.
Interessanterweise trat dieses Problem nicht bei allen Datenbanken auf – warum kann ich im Moment noch nicht sagen.
Ergänzung: Es ist wichtig die Schritte in der absolut richtigen Reihenfolge auszuführen:
- emctl stop agent
- emctl resetTZ agent
- SQL set_agent_tzrgn
- emctl start agent
Update: Eine interessante Entwicklung: Ich stieß ein Script an, welches eben diese vier Schritte auf allen Solaris-Zonen ausführen sollte. Nachdem das geschehen war, kamen die entsprechenden Datenbanken wie gewünscht wieder online .. und dazu auch alle anderen Datenbanken. O_o
Das heisst: Tatsächlich muss das Problem an einem mir nicht bekannten Agenten gehangen haben und dessen Sauberstellung sorgte dann dafür, dass sich überall – sogar bei den Windowsmaschinen – die Klemme von allein löste. Faszinierend. :/