Zwischen Weihnachten und Neujahr hatte ich mir vorgenommen, bei www.cray-cyber.org die Cray T3E in Betrieb zu nehmen. Gestern und vorgestern war es dann soweit. Am Montag angekommen, haben sich John und Benjamin bereits über die „kleine“ T3E mit 28 PEs (entspricht 28 Alpha 21164 Prozessoren mit je 300 MHz) gestürzt und die Torus Verkabelung fertiggestellt. Blieb eigentlich nur noch die Clock Verkabelung übrig. Die dünnen fummeligen Kabel konnte man nur noch durch Verlöten miteinander verbinden. Danach kam der große Moment: Sicherung umlegen und die Start Prozedur einleiten. Ohne Handbuch bzw. eine genaue Anleitung wären wir vermutlich verzweifelt:
- IO-Rack Hauptsicherung umlegen
- Festplatten Arrays einschalten
- IO-Server einschalten und warten bis er hochgefahren ist (Running)
- Fibre Channel Controller (FCN1) Sicherung umlegen und warten bis die LEDs links und zweite von links alleine leuchten
- T3E Cabinet #1 Ein/Ausschalter in der Türe einschalten
- T3E Cabinet #1 Hauptsicherung umlegen
- T3E Cabinet #1 Blower, WACS, Clock-Board Sicherung prüfen
- T3E Cabinet #1 Sicherungen pro PE Modul prüfen
- T3E Cabinet #1 Remote Enable Schalter aktivieren
Das gleiche noch mal für das zweite Cabinet, mit Ausnahme Clock Board Sicherung, da lediglich im Cabinet #1 ein Clock Board installiert ist.
Danach muss man sich an der Admin Workstation (SWS) anmelden und
$ nwacsuser
ausführen, die zwei T3E Cabinets remote anwerfen (Power On) und beim Cabinet #1 die Schalter TKC => TKCS und Soft Scan => Enable setzen.
Danach
$ bootsys -c
ausführen.
Wir konnten es kaum fassen, aber die T3E bootete tatsächlich einen UNICOS Kernel !!! Doch das mounten des Root Dateisystems schlug fehl. Wir hatten vergessen die Festplatten zu installieren. Nun ging die Sucherei los. Wo sind die Platten dieser T3E ? Gesucht – gefunden, haben wir dann beschlossen die eiskalten Festplatten erst mal aufwärmen zu lassen.
Ausgeschlafen ging es am Dienstagmorgen frisch ans Werk. Die Festplatten wurden installiert und wir starteten die Maschine. Allerdings hagelte es beim Booten (bootsys) nach kurzer Zeit jede Menge Fehlermeldungen. Darauf waren wir gar nicht gefasst! Bei einem weiteren Versuch die T3E zu booten, hagelte es erneut Fehlermeldungen, aber diesmal andere als zuvor. Und so zog sich das bis etwa Mittag hin. Wir versuchten den Fehler einzukreisen und jedes Mal überraschte uns die T3E mit neuen Fehlermeldungen. Was für eine Katastrophe.
Mit etwas Glück klickten sich Benjamin und ich durch ein Diagnose Tool von Cray. Dabei starteten wir mehrfach ein Programm, welches Reinigungsmaßnahmen an der T3E vornahm. Irgendwann meldet dieses, dass alles in Ordnung sei. Prompt booteten wir die Maschine und wir konnten die T3E tatsächlich komplett hochfahren. Erleichterung machte sich breit. Allerdings hatte ich die Platten falsch eingehängt und so klemmte es im Init Prozess ordentlich. Wir beschlossen die Maschine nochmal per haltsys auszuschalten, die Platten umzuhängen und danach noch mal alles hochzufahren.
Leider war das erneute Hochfahren nicht von Erfolg gekrönt, es hagelte wieder Fehlermeldungen, bevor die Cray überhaupt mal einen Kernel laden konnte. Die Fehlersuche ging von vorne los.
Nach dem leckeren Essen beim Italiener, kam mir die Idee, einfach mal die sogenannte GigaRing Verkabelung durchzutauschen… ich hatte irgendwie Kabel im Verdacht. Auch diese Maßnahme führte nicht zum erhofften Erfolg. Allerdings war die Cray zwischenzeitlich so gnädig und versteifte sich auf exakt ein und dieselbe Fehlermeldung. John wälzte das Handbuch und mittels speziellen Diagnose Tools konnten wir dann das Problem mehr und mehr auf den GigaRing einschränken. Als ich dann wieder auf die alte GigaRing Verkabelung umschraubte, meldeten das GigaRing Diagnose Tool, dass alles in Ordnung ist! Aufgeregt wie kleine Kinder starteten wir wieder die T3E und sie bootete durch bis in den Multiuser Mode. Juhuuuuuuuuu Mission komplett – die T3E lebt ! 🙂
Fazit: Ich finde die T3E super spannend und sie ist zu allem Überfluss verdammt leise. Am liebsten würde ich mir eine ins Wohnzimmer stellen. 🙂 Aber John will mir keine T3E abgeben. 😉
Zum Abschluß noch ein paar Impressionen von der Cray T3E: