miércoles, 31 de diciembre de 2008

AIX: Cambios en los discos de un VG

A lo largo de la vida de un grupo de volúmenes (VG) le pueden suceder muchas cosas. Las más comunes son en relación con su tamaño o el de sus volúmenes físicos.

Cuando ha cambiado el tamaño de algún volumen físico (PV) AIX no se da cuenta de ello en caliente. Es un caso típico de que el disco está externalizado y se ha ampliado alguna de las LUNs que corresponden con los dispositivos hdiskX que existen en un VG. Conseguimos que recalcule el tamaño de disco disponible con lo siguiente:

# chvg -g

Más info en IBM.



viernes, 26 de diciembre de 2008

XEN en serio

Este 23 de Diciembre de 2008 se ha anunciado el 1st International Workshop on Grids, Clouds and Virtualization. Se trata de las primeras conferencias auspiciadas bajo el manto de Xen que tratan sobre los tópicos de moda cloud computing, grid y virtualización. Ya sabíamos que Xen es un proyecto serio de futuro pero con el reciente apoyo de Oracle sabemos que es apuesta segura.

Kernel 2.6.28

Papá Noel no descansa y nos ha traído esta Nochebuena un nuevo kernel Linux 2.6.28 que incluye ilusionantes mejoras entre las que destacan por populares: CPU hotplugging para XEN, importante soporte de hardware asociado a procesadores ARM y el soporte para ext4 (presentado hace unos meses) y OCFS2 mejorado. Todo esto y mucho más relacionado con drivers, protocolos de red y mejoras varias.

De ext4 hablaremos en otro post porque presenta interesantes cualidades que ya conocíamos de otros sistemas de ficheros a las que vamos a sacar gran provecho.

AIX: Migración de almacenamiento

Un problema típico de la explotación de los sistemas actuales es la de no poder detenerlos "casi" nunca. A menudo tenemos incidencias de disco, como conexiones a SAN, discos internos a los que se le agota el espacio libre, migración de datos entre máquinas, etc..

Lo primero que uno piensa es que posiblemente tengamos que parar los servicios que se sirven de los sistemas de ficheros que necesitamos mover, por mucho que los nuevos discos sean HotPlug o la SAN esté accesible.

La idea para evitar la parada es usar el LVM de manera inteligente. Para ir a lo concreto vamos a hacer el ejercicio de mover sistemas de ficheros de un disco (ej:local) a otro nuevo (ej:SAN) sin tener que detener los servicios. Ni que decir tiene que el disco nuevo (hdisk2) debe de tener capacidad para acoger lo que contiene el disco original (hdisk1).
La receta consiste en:

1.- Conectar el nuevo disco (hdisk2) y asegurarnos de que está disponible
# cfgmgr
# lsdev -Cc disk

2.- Añadir el disco al grupo de volúmenes donde están los FS (datosvg)
# /usr/sbin/extendvg datosvg hdisk2

3.- Mover los volúmenes lógicos del disco origen (hdisk1) al nuevo disco (hdisk2)
# /usr/sbin/migratepv hdisk1 hdisk2

4.- Eliminar el disco original (hdisk1) del
# /usr/sbin/reducevg datosvg hdisk2

5.- Finalmente podemos comprobar que el disco original no contiene nada o que el disco nuevo contiene los sistemas de ficheros
# lspv -l hdisk1
# lspv -l hdisk2


También se puede utilizar este método para resolver las siguientes situaciones:
- Ir a un disco con diferente nivel de RAID
- Desfragmentar el uso de un VG en varios discos hacia otra configuracion de discos deseada
- Mover el rootvg a un disco SAN. Podemos tener problemas en el boot. En otro post lo abordaremos.

AIX: Problemas con la ODM

Los siguientes mensajes son de lo más alarmante que podemos obtener en AIX:
0516-1734 mklvcopy: Warning, savebase failed.  Please manually run 'savebase' before rebooting.
0516-1734 chvg: Warning, savebase failed. Please manually run 'savebase' before rebooting.
0516-1734 mirrorvg: Warning, savebase failed. Please manually run 'savebase' before rebooting.

Los solemos ver en los mismos escenarios que este otro error:
0503-409 installp:  bosboot verification starting...
0503-497 installp: An error occurred during bosboot verification processing.

La primera lectura la solemos hacer en función del comando que estábamos empleando, pero su significado real suele estar relacionado con el disco de boot.

El motivo es que el dispositivo de boot está apuntando al disco incorrecto aunque no lo parezca. Aplicamos la secuencia siguiente si tenemos la certeza de que queremos usar hdisk0 porque es ahí donde está el LV hd5 (el de boot en AIX):

Vemos si salen errores y comprobamos el disco donde está hd5:
# bosboot -v
# lslv -m hd5
hd5:N/A
LP PP1 PV1 PP2 PV2 PP3 PV3
0001 0001 hdisk0 0001 hdisk1

En el ejemplo anterior se cree que la partición hd5 está también en el disco hdisk1 (probablemente un mirror deshecho o un migratepv) cuando parece que ya no es así.

Rehacemos el enlace entre el disco correcto (en este caso el hdisk0) y el ipldevice:
# ln /dev/hdisk0 /dev/ipldevice

Rehacemos la imagen de arranque:
# bosboot -ad /dev/ipldevice
bosboot: Boot image is 36250 512 byte blocks.

Rehacemos el bootlist. (Primero lo comprobamos ?)
# bootlist -m normal -o hdisk0
hdisk0 blv=hd5

AIX: Alias IP

Creación de AliasIP

Una vez hemos seleccionado la interfaz de red y sabemos la máscara y la IP podemos acudir al SMIT o hacerlo con el comando:
# chdev -l en0 -a alias4='1.2.3.XXX,255.255.255.0' -P

Se puede poner un alias IP “no permanente” con el comando:
# ifconfig en0 1.2.3.XXX netmask 255.255.255.0 alias

Eliminar un Alias IP

A la hora de eliminar un alias Ip y para evitar que ocurran cosas raras en el SMIT propongo la siguiente receta:

1.- Para mirar los alias IP emplearemos el comando siguiente:
nona:/ # lsattr -H -El en0| grep alias4
alias4 1.2.3.10,255.255.255.0 IPv4 Alias including Subnet Mask True
alias4 1.2.3.11,255.255.255.0 IPv4 Alias including Subnet Mask True
alias4 1.2.3.12,0xffffff00 IPv4 Alias including Subnet Mask True

Obsérvese que la máscara unas veces están en hexadecimal y otras en decimal. Para borrar el alias hay que especificar la máscara tal como aparece ahí textualmente. Los siguientes son 2 ejemplos válidos respectivos:
chdev -l en0 -a delalias4=1.2.3.11,255.255.255.0 -P
chdev -l en0 -a delalias4=1.2.3.12,0xffffff00 -P

Puede ocurrir que ya no vemos la IP en el ifconfig pero si en el “lsattr”. En ese caso primero volvemos a configurar el alias con el siguiente comando y volvemos a aplicar la receta anterior para el borrado:
ifconfig en0 alias <ip>

Si obtenemos una salida como la siguiente:
Method error (/usr/lib/methods/chgif):
0514-009 Cannot delete an object from the device
configuration database.
0821-232 chgif: Cannot delete alias6 (155.54.216.59) from CuAt.

Puede estar sucediendo una de 2 cosas:
- CASO1: La IP ya no se ve en el listado “lsattr” → ya está eliminada y hemos terminado.
- CASO2: La IP se sigue viendo en el listado “lsattr” → no estamos indicando textualmente la máscara.

NOTA:Eliminar un alias con el siguiente comando provoca que en el siguiente reinicio o “cfgmgr” se puede volver a activar el alias. No queda permamentemente eliminado:
ifconfig en0 delete 1.2.3.12

Por último, llamo la atención sobre que es posible que la tabla de ruta no quede como estaba y merece un repasito.

sábado, 5 de enero de 2008

3,2,1,....0!

La intención de este blog es servir de foro de intercambio de mi experiencia como administrador de sistemas con la vuestra. De paso a alguien puede resultar interesante para iniciarse en estos temas. Nos vemos pronto.