티스토리 뷰

OS/Storage

HP-UX 클러스터

solarwind 2008. 6. 25. 20:49
반응형

클러스터나 그 구성 요소 노드는 다른 시기에 여러 다른 상태로 있을 수 있습니다. 클러스터, 패키지 및 기타 클러스터 요소에 대한 상태 정보는 cmviewcl 명령의 출력과 일부 Serviceguard Manager의 디스플레이로 표시됩니다. 이 절은 클러스터 또는 패키지에서 나타날 수 있는 많은 공통 상황의 의미에 대해 설명합니다.

클러스터 상황에 대한 정보는 클러스터의 개별 노드에 대해 유지 관리되는 상태 데이터베이스에 저장됩니다. 이 데이터베이스에 포함된 정보는 cmviewcl 명령을 실행하여 표시할 수 있습니다:

# cmviewcl -v 

-v 옵션을 사용하여 명령을 실행하면 전체 클러스터에 대한 정보가 표시됩니다. cmviewcl 옵션에 대한 자세한 설명은 맨페이지를 참조하십시오.

팁: 일부 명령은 대규모 구성에서 완료되는 데 긴 시간이 걸립니다. 특히 패키지 및 서비스 수가 증가하면 cmviewcl -v 중에 Serviceguard의 CPU 사용이 늘어날 수 있습니다.

이전의 특정 릴리즈에서 사용하던 형식으로 출력되게 하고 싶을 때는 -r 옵션으로 원하는 릴리즈를 지정하면 됩니다. 예:

# cmviewcl -r A.11.16

다른 cmviewcl 옵션에 대한 자세한 내용은 맨페이지를 참조하십시오.

클러스터 및 패키지 상태의 종류

클러스터나 그 구성 요소 노드는 다른 시기에 여러 다른 상태로 있을 수 있습니다. 다음 절은 클러스터나 패키지의 일반적인 여러 조건에 대해 설명합니다.

클러스터 상태

클러스터의 상태는 다음 중 하나일 수 있습니다.

  • Up. 적어도 하나 이상의 노드에 실행 중인 클러스터 데몬이 있고 재편성이 일어나지 않습니다.

  • Down. 클러스터에 클러스터 데몬을 실행 중인 노드가 없습니다.

  • Starting. 클러스터는 활성 구성원을 확인하는 프로세스 중에 있습니다. 적어도 하나 이상의 클러스터 데몬이 실행 중입니다.

  • Unknown cmviewcl. 명령이 실행되는 노드는 클러스터 내의 다른 노드와 통신할 수 없습니다.

노드 상황 및 상태

노드의 상태는 클러스터 데몬의 실행 여부에 따라 Up(활성 클러스터 멤버) 또는 Down(비활성 클러스터) 중 하나입니다. 클러스터 입장에서 보면 노드가 작동 중단 상태이지만 여전히 HP-UX가 시작되어 실행되고 있습니다.

또한 노드는 다음 상태 중 하나에 있을 수 있습니다.

  • Failed. 노드는 이 상태에서는 자신을 볼 수 없습니다. 클러스터의 다른 활성 구성원들은 해당 노드가 활성 클러스터에 있었지만 더 이상은 그렇지 않으며 중지되지 않은 경우 이 상태의 노드를 볼 수 있습니다.

  • Reforming. 클러스터가 재편성 중일 때 노드는 이 상태가 됩니다. 이 상태의 노드는 모든 노드가 활성 클러스터의 새 구성원에 동의함을 보장하는 프로토콜을 실행하는 중입니다. 동의에 도달할 경우 상황 데이터베이스는 새 클러스터 구성원을 반영하도록 업데이트됩니다.

  • Running. 이 상태의 노드는 마지막으로 재편성을 위해 필요한 모든 작업을 완료하고 정상적으로 작동 중입니다.

  • Halted. 노드는 이 상태에서는 자신을 볼 수 없습니다. 다른 노드는 이 노드가 cmhaltnode 명령 등을 사용하여 활성 클러스터에 남겨진 다음 이 상태에서 노드를 볼 수 있습니다.

  • Unknown. 노드는 이 상태에서는 자신을 볼 수 없습니다. 다른 노드는 노드가 활성 클러스터 구성원이 아닐 경우 노드를 이 상태에 할당합니다.

패키지 상황 및 상태

패키지의 상태는 다음 중 하나일 수 있습니다.

  • Up. 패키지 제어 스크립트가 활성 상태입니다.

  • Down. 패키지 제어 스크립트가 활성 상태가 아닙니다.

  • Unknown.

패키지의 상태는 다음 중 하나일 수 있습니다.

  • Starting. 제어 스크립트의 시작 명령이 실행 중입니다.

  • Running. 서비스가 활성 상태이고 모니터링 중입니다.

  • Halting. 제어 스크립트의 중지 명령이 실행 중입니다.

패키지 전환 속성

또한 패키지는 다음의 전환 속성을 갖습니다.

  • Package Switching. Enabled는 장애가 발생한 경우 패키지가 다른 노드로 전환할 수 있음을 의미합니다.

  • Switching Enabled for a Node. Enabled는 패키지가 참조된 노드로 전환할 수 있음을 의미합니다. Disabled는 cmmodpkg 명령을 사용하여 패키지에 대해 노드가 활성화되기 전에는 패키지가 지정한 노드로 전환할 수 없음을 의미합니다.

    패키지에 대한 기본 또는 대체 노드에 해당하는 각 노드에 대해 모든 패키지는 Enabled 또는 Disabled로 표시됩니다.

그룹 멤버쉽 상황

Oracle RAC에 대한 클러스터 상태는 다음 중 하나입니다.

  • Up. 서비스가 활성 상태이고 모니터링 중입니다. 멤버쉽은 cmviewcl -l 그룹의 출력에 표시됩니다.

  • Down. 클러스터가 중지되고 GMS 서비스가 중지되었습니다. 멤버쉽은 cmviewcl -l 그룹의 출력에 표시되지 않습니다.

다음은 cmviewcl 명령에서 볼 수 있는 그룹 멤버쉽 출력의 예입니다.

# cmviewcl -l group

GROUP MEMBER PID MEMBER_NODE
DGop 1 10394 comanche
0 10499 chinook
DBOP 1 10501 comanche
0 10396 chinook
DAALL_DB 0 10396 comanche
1 10501 chinook
IGOPALL 2 10423 comanche
1 10528 chinook

여기에서 cmviewcl 출력 값은 다음과 같습니다.

GROUP  

구성된 그룹의 이름

MEMBER  

그룹 구성원의 ID 번호

PID  

그룹 구성원의 프로세스 ID

MEMBER_NODE  

그룹 구성원이 실행되고 있는 노드

서비스 상황

서비스의 상태는 다음 중 하나입니다.

  • Up. 서비스가 모니터링 중입니다.

  • Down. 서비스가 실행되고 있지 않습니다. 서비스가 중지되거나 실패했을 수 있습니다.

  • Uninitialized. 이 서비스는 패키지 구성에 포함되어 있으나 제어 스크립트의 실행 명령으로 시작되지 않았습니다.

  • Unknown.

네트워크 상황

네트워크 인터페이스의 상태는 다음 중 하나입니다.

  • Up.

  • Down.

  • Unknown. 인터페이스가 작동 중인지 작동 중단 상태인지 확인할 수 없습니다. 이것은 클러스터가 작동 중단 상태일 때 발생할 수 있습니다. 대기 인터페이스는 이 상황만 갖습니다.

직렬 회선 상황

직렬 회선의 상태는 다음 중 하나입니다.

  • Up. 직렬 회선을 통해 하트비트가 수신됩니다.

  • Down. 하트비트가 NODE_TIMEOUT 값의 2배 이내에서 직렬 회선에 수신되지 않았습니다.

  • Recovering. 직렬 회선으로 잘못된 메시지가 수신되었기 때문에 다시 동기화 과정이 진행되고 있습니다.

  • Unknown. 직렬 회선이 작동 중인지 작동 중단 상태인지 확인할 수 없습니다.
    이 상황은 원격 노드가 작동 중단될 때 발생할 수 있습니다.

장애 조치 및 장애 복구 정체

패키지는 FAILOVER_POLICY 매개 변수에 대한 두 값 중 하나로 구성될 수 있습니다.

  • CONFIGURED_NODE. 패키지가 패키지 구성 파일의 노드 목록의 다음 노드로 장애 조치됩니다.

  • MIN_PACKAGE_NODE. 패키지가 가장 적은 수의 패키지를 실행하고 있는 노드로 장애 조치됩니다.

패키지는 FAILBACK_POLICY 매개 변수에 대한 두 값 중 하나로 구성될 수 있습니다.

  • AUTOMATIC. 이 설정인 패키지는 장애 조치 후, 주 노드가 다시 사용 가능하게 되었을 때 주 노드로 복귀합니다.

  • MANUAL. 이 설정인 패키지는 장애 조치 후 시스템 관리자가 직접 원래 노드로 이동시켜야 합니다.

장애 조치 및 장애 복구 정책은 cmviewcl -v 명령의 출력에 표시됩니다.

클러스터 및 패키지 상태의 예

다음 cmviewcl -v 명령의 샘플 출력은 샘플 구성의 클러스터에 대한 상태를 보여 줍니다.

정상 작동 상황

모든 것이 정상적으로 실행되고 있습니다. 2 노드 클러스터의 양 노드가 실행 중이고 각 Oracle RAC 인스턴스 패키지도 실행 중입니다. 실행 중인 패키지는 Oracle RAC 인스턴스 패키지뿐입니다.

CLUSTER      STATUS
example      up
  NODE         STATUS       STATE
  ftsys9       up           running

    Network_Parameters:
    INTERFACE    STATUS       PATH         NAME
    PRIMARY      up           56/36.1      lan0
    STANDBY      up           60/6         lan1

    PACKAGE      STATUS       STATE        AUTO_RUN    NODE
    ops_pkg1     up           running      disabled     ftsys9

      Policy_Parameters:
      POLICY_NAME      CONFIGURED_VALUE
      Start        configured_node
      Failback     manual

      Node_Switching_Parameters:
      NODE_TYPE    STATUS       SWITCHING    NAME
      Primary      up           enabled      ftsys9       (current)

  NODE         STATUS       STATE
  ftsys10      up           running

    Network_Parameters:
    INTERFACE    STATUS       PATH         NAME
    PRIMARY      up           28.1         lan0
    STANDBY      up           32.1         lan1

    PACKAGE      STATUS       STATE        AUTO_RUN    NODE
    ops_pkg2     up           running      disabled     ftsys10

      Policy_Parameters:
      POLICY_NAME      CONFIGURED_VALUE
      Start        configured_node
      Failback     manual

      Node_Switching_Parameters:
      NODE_TYPE    STATUS       SWITCHING    NAME
      Primary      up           enabled      ftsys10      (current)
      Alternate    up           enabled      ftsys9

쿼럼 서버 상황

클러스터에서 계층 구분 서비스에 쿼럼 서버를 사용할 경우 다음 cmviewcl -v의 출력 결과에서 인용한 것처럼 각 노드 항목 뒤에 서버 이름, 상태 등이 표시됩니다.

CLUSTER      STATUS
example      up

  NODE         STATUS       STATE
  ftsys9       up           running

  Quorum Server Status:
  NAME STATUS STATE
  lp-qs               up           running
...

  NODE         STATUS       STATE
  ftsys10      up           running

  Quorum Server Status:
  NAME STATUS STATE
  lp-qs               up           running

CVM 패키지 상황

클러스터가 디스크 저장 장치에 대해 VERITAS 클러스터 볼륨 관리자를 사용할 경우 응용 프로그램에서 CVM 디스크 그룹 액세스가 가능하도록 모든 활성 노드에서 시스템 다중 노드 패키지인 CVM-VxVM-pkg가 실행되어야 합니다. 이 패키지는 다음 cmviewcl 명령의 출력에 표시됩니다.

CLUSTER      STATUS       
example      up

NODE STATUS STATE
ftsys8       down         halted
ftsys9       up running

SYSTEM_MULTI_NODE_PACKAGES:

PACKAGE STATUS STATE
VxVM-CVM-pkg up           running


-v 옵션을 사용할 경우 다음과 같이 클러스터의 각 활성 노드와 관련된 시스템 다중 노드 패키지가 표시됩니다.

SYSTEM_MULTI_NODE_PACKAGES:

    PACKAGE STATUS STATE
    VxVM-CVM-pkg up running

     NODE STATUS STATE
     ftsys8       down         halted

     NODE STATUS STATE
     ftsys9       up running
      Script_Parameters:
      ITEM STATUS MAX_RESTARTS RESTARTS NAME
      Service up 0 0 VxVM-CVM-pkg.srv

패키지를 다른 노드로 이동한 후의 상황

다음 명령을 실행하십시오.

# cmrunpkg -n ftsys9 pkg2 

cmviewcl -v 명령의 출력은 다음과 같습니다.

CLUSTER      STATUS
example      up

  NODE         STATUS       STATE
  ftsys9       up           running

    Network_Parameters:
    INTERFACE    STATUS       PATH         NAME
    PRIMARY      up           56/36.1      lan0
    STANDBY      up           60/6         lan1


    PACKAGE      STATUS       STATE        AUTO_RUN    NODE
    pkg1         up           running      enabled      ftsys9

      Policy_Parameters:
      POLICY_NAME      CONFIGURED_VALUE
      Failover     min_package_node
      Failback     manual

      Script_Parameters:
      ITEM         STATUS  MAX_RESTARTS   RESTARTS       NAME
      Service      up          0          0       service1
      Subnet       up          0          0       15.13.168.0
      Resource     up                           /example/float

      Node_Switching_Parameters:
      NODE_TYPE    STATUS  SWITCHING    NAME
      Primary      up      enabled      ftsys9       (current)
      Alternate    up      enabled      ftsys10

    PACKAGE      STATUS       STATE        AUTO_RUN    NODE
    pkg2         up           running      disabled     ftsys9

      Policy_Parameters:
      POLICY_NAME      CONFIGURED_VALUE
      Failover     min_package_node
      Failback     manual

      Script_Parameters:
      ITEM       STATUS   NAME       MAX_RESTARTS    RESTARTS
      Service      up    service2.1     0           0
      Subnet       up    15.13.168.0    0           0

      Node_Switching_Parameters:
      NODE_TYPE    STATUS    SWITCHING    NAME
      Primary      up        enabled      ftsys10
      Alternate    up        enabled      ftsys9     (current)

  NODE         STATUS       STATE
  ftsys10      up           running

    Network_Parameters:
    INTERFACE    STATUS       PATH         NAME
    PRIMARY        up           28.1         lan0
    STANDBY        up           32.1         lan1

현재 pkg2는 노드 ftsys9에서 실행 중입니다. 이 패키지는 여전히 전환이 불가능합니다.

패키지 전환이 사용 가능으로 설정된 후의 상황

다음 명령은 패키지의 상태를 다시 Auto Run Enabled로 변경합니다.

# cmmodpkg -e pkg2 

cmviewcl 명령의 출력은 이제 다음과 같습니다.

CLUSTER      STATUS
example      up

  NODE         STATUS       STATE
  ftsys9       up           running

    PACKAGE      STATUS       STATE        AUTO_RUN    NODE
    pkg1         up           running      enabled      ftsys9
    pkg2         up           running      enabled      ftsys9

  NODE         STATUS       STATE
  ftsys10      up           running

두 패키지가 현재 ftsys9에서 실행 중이고 pkg2는 전환이 가능합니다. Ftsys10은
데몬을 실행 중이며 ftsys10에서 실행 중인 패키지는 없습니다.

노드 중지 후 상황

ftsys10을 중지한 다음 다음 명령을 사용합니다.

# cmhaltnode  ftsys10 

cmviewcl의 출력이 ftsys9 뒤에 이어집니다.

CLUSTER      STATUS
example      up

  NODE         STATUS       STATE
  ftsys9       up           running

    PACKAGE      STATUS       STATE        AUTO_RUN    NODE
    pkg1         up           running      enabled      ftsys9
    pkg2         up           running      enabled      ftsys9

  NODE         STATUS       STATE
  ftsys10      down         halted

이 출력은 ftsys9ftsys10 모두에서 표시됩니다.

RS232 상황 보기

하트비트 연결로 직렬(RS232) 회선을 사용할 경우 cmviewcl -v 명령의 출력에 구성된 RS232 장치 파일의 목록이 나타납니다. 다음은 정상적으로 실행 중인 상태를 나타냅니다.

CLUSTER      STATUS
example      up
  NODE         STATUS       STATE
  ftsys9       up           running

    Network_Parameters:
    INTERFACE    STATUS       PATH         NAME
    PRIMARY      up           56/36.1      lan0
 
    Serial_Heartbeat:
    DEVICE_FILE_NAME      STATUS   CONNECTED_TO:
    /dev/tty0p0             up        ftsys10     /dev/tty0p0
  NODE         STATUS       STATE
  ftsys10       up           running

    Network_Parameters:
    INTERFACE    STATUS       PATH         NAME
    PRIMARY      up           28.1         lan0
 
    Serial_Heartbeat:
    DEVICE_FILE_NAME      STATUS    CONNECTED_TO:
    /dev/tty0p0              up        ftsys9      /dev/tty0p0

다음은 직렬 회선이 작동 중이지 않을 때의 상황을 나타냅니다.

CLUSTER      STATUS
example      up
  NODE         STATUS       STATE
  ftsys9       up           running

    Network_Parameters:
    INTERFACE    STATUS       PATH         NAME
    PRIMARY      up           56/36.1      lan0
 
    Serial_Heartbeat:
    DEVICE_FILE_NAME      STATUS       CONNECTED_TO:
    /dev/tty0p0             down          ftsys10  /dev/tty0p0
  NODE         STATUS       STATE
  ftsys10       up           running

    Network_Parameters:
    INTERFACE    STATUS       PATH         NAME
    PRIMARY      up           28.1         lan0
 
    Serial_Heartbeat:
    DEVICE_FILE_NAME      STATUS    CONNECTED_TO:
    /dev/tty0p0             down       ftsys9      /dev/tty0p0

무소속 패키지 데이터 보기

다음 예제는 무소속 패키지(Unowned Package), 즉 구성된 노드 어느 곳에서도 실행되고 있지 않은 패키지를 보여줍니다. 패키지가 실행될 수 있는 각각의 노드에 대해서 모니터되는 리소스에 대한 정보가 제공됩니다. 이를 이용하여 장애의 원인을 찾아내고 어디서 패키지를 다시 시작할지 판단할 수 있습니다.

UNOWNED_PACKAGES

PACKAGE STATUS STATE AUTO_RUN NODE
PKG3 down halted enabled unowned

Policy_Parameters:
POLICY_NAME CONFIGURED_VALUE
Failover min_package_node
Failback automatic

Script_Parameters:
ITEM STATUS NODE_NAME NAME
Resource up       manx         /resource/random
Subnet up manx         192.8.15.0
Resource up       burmese      /resource/random
Subnet up burmese      192.8.15.0
Resource up       tabby        /resource/random
Subnet up tabby        192.8.15.0
Resource up       persian      /resource/random
Subnet up persian      192.8.15.0

Node_Switching_Parameters:
NODE_TYPE STATUS SWITCHING NAME
Primary up enabled manx
Alternate up enabled burmese
Alternate up enabled tabby
Alternate up enabled persian
반응형
댓글
반응형
공지사항
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
링크
«   2024/05   »
1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30 31
글 보관함