A czytałeś FAQ? ;-)


Kilka awarii

Zamieszczone w linux, serwery przez undefine dnia 2008-01-11

(post pisany jakiś czas temu, ale nieopublikowany. Publikuję, bo a nóż się komuś coś przyda ;)

Jak zapewne niektórzy zauważyli - zdażyło się ostatnio kilka awarii ;)

Od początku:

  1. W sobotę(8.12.2007), po zawodach mwpz - padł sobie dysk w kronosie. Cóż - po prostu padł. Podobnie jak i poprzedni dyszczek nagle przestał się kręcić. Można by sie temu dziwić, gdyby nie to że kronos ma już kilka swoich latek, a blisko 7 lat nieprzerwanej pracy to dosyć nawet jak dla dysku scsi.
  2. Na kronosie stało kilka maszyn wirtualnych (opartych o linux-vserver), a na tym miedzy innymi sprawdzarka acm-u jak również vserver z wiki.

Z tego też powodu przez jakiś czas część usług była niedostępna. Co prawda starałem się wszystko jak najszybciej przywrócić, ale.. wyszło jak zwykle.

Szczegóły pominę - w każdym razie obecnie wszystko zostało z kronosa wyniesione na hypnosa i jak na razie działa.

Dlaczego na razie?

Przyszła nowa, długo oczekiwana macierz z dyskami. Tak, problem z brakującym miejscem zmierza ku końcowi. Mniej przyjemnym aspektem tego była konieczność rekonfiguracji obecnego systemu. Z uwagi na problemy z windows(atlas), nowa macierz została podłączona przed starą macierzą z dyskami systemowymi. Efektem tego jest niestety to, że linuksowe serwery, do tej pory korzystające z starej macierzy - obecnie przed dyskami z niej wykrywają dyski z nowej macierzy. Co wyklucza możliwość korzystania z nazw typu /dev/sda itepe.

Rozwiązanie jest niby proste - użycie LABEL-i albo UID-ów. Tylko że:

  • pld używany na hypnosie i omedze nie obsługuje  przy starcie użycia root=LABEL ani root=UID. Nikt tego jeszcze nie miał okazji zaimplementować - wymaga toto wykrycia przez blkid albo coś w tym stylu etykiet dysków i użycia ich… Albo bootowanie tegoż w inny sposób (jeszcze się może kiedyś bardziej na ten temat rozpiszę…)
  • centos na najnowszym jajku nie wykrywa dysku. hgw dlaczego, nieszczegolnie jak mam to diagnozować… po downgradzie do 2.6.18-8.1.15 jakoś działa (obsługując labele/uidy).

Potencjalne problemy typu konflikt labeli jak gdzieś indziej jakiś inny dysk wykryje - pomijam…

Obecnie calosc jest jako tako poskejana i do rebootu chodzi. A jak się rebootnie - to się zobaczy ;) W każdym razie wszystko co stoi na hypnosie - może się zdażyć że przez kilka h będzie niedostępne.

Oczywiście w wolnych chwilach pracuję nad rozwiazaniem problemu, ale - wolnych chwil za dużo nie ma, więc całość się może przeciągnąć….

Zostaw odpowiedź