Cargar campos “COBOL Comp-3 (Packed Decimals)” con Multiload.

Teradata permite conexión directa entre entornos “mainframe” y sistemas Teradata mediante conexiones FICON. Esto significa que se pueden instalar las TTU’s en dichos “mainframes” y cargar directamente datos desde ficheros que existan allí sin necesidad de hacer ftp’s a entornos UNIX, Linux o Windows, con lo engorroso que puede ser el ftp en sí, por no hablar de las conversiones EBCDIC / ASCII…

El problema viene cuando los ficheros en cuestión contienen campos “Comp-3” (Computational-3), también llamados “packed decimals“.

Pero ¿qué son exactamente estos “Comp-3”?

“Comp-3” es una forma de almacenamiento de datos numéricos en COBOL en formato BCD (binary coded decimal). El BCD almacena numeros en formato DECIMAL y,como los números decimales van de 0 a 9, caben en cuatro bits (es lo que se llama un ‘nibble‘) con lo que en un byte caben dos números (ej.: byte 11, en bin 00010001 => almacena el 11 decimal). Esto hace que los datos ocupen la mitad de lo que ocuparían como caracteres (un byte por cada dígito).

A esto hay que sumarle que el último nibble (el menos significativo) se guarda para el signo, y se notan como “C” hex para positivos, “D” hex para negativos y “F” hex para “unsigned“. Así el número 1000 se guardará en tres bytes como 01 00 0C.

Para calcular lo que ocupará un número en Comp-3 bastará con contar sus dígitos, sumarle uno para el signo y dividir por dos. En caso de que el resultado no sea entero se redondea hacia arriba. En nuestro ejemplo anterior: 1000 => (4+1)/2 = 2,5 y se redondea a 3.

OK, pero ¿cómo se guardan los decimales? pues NO se guardan, sino que se resuelven con los ‘PICTURES’ (PIC). Siguiendo con nuestro ejemplo, si el campo es definido como ‘PIC S9(4)’, será 1000, pero si lo definimos como PIC S9(2)V99 se convertirá en 10.00.

Vale. Ahora ya sabemos lo que son pero ¿cómo los cargamos con Multiload?

Un poco de calma. Antes vamos ver cómo nosotros linuxeros y windowseros hemos adquirido vicios a la hora de cargar ficheros, en este caso con multiload, y más tarde nos daremos cuenta de que las cosas son más fáciles de lo que parecen…

¿Qué hacemos normalmente para cargar ficheros? Pues normalmente elegimos entre ficheros “TEXT” (de registros de longitud fija) y ficheros “VARTEXT” (registros de longitud variable con separadores de campo). Y a la hora de definir el LAYOUT definimos generalmente campos CHAR() o VARCHAR() donde colocar la información de los campos del fichero, que suelen llegar en forma de texto (ASCII, o UTF8, o lo que sea…). El objeto de esto es que el LAYOUT guarde la información en texto y que los cambios de tipo (CASTs) se resuelvan a la hora de la inserción final en las tablas.

Esto funciona generalmente muy bien, pero hace que olvidemos cómo funciona el multiload (en realidad el dataconector o “PIOM” para los más viejos).

Vamos a ver un ejemplo:

Tenemos un fichero Prueba.txt de longitud fija (4 bytes por registro) que tiene:

1UNO
2DOS

Tenemos una tabla para cargar dicho fichero:

 BTEQ -- Enter your SQL request or BTEQ command: 
DROP TABLE CARLOS.PRUEBA_TEXT;
CREATE MULTISET TABLE CARLOS.PRUEBA_TEXT
   (
      ID_N  INTEGER NOT NULL,
      C_TXT CHAR(3)
   )
;

 *** Failure 3807 Object 'CARLOS.PRUEBA_TEXT' does not exist.
                Statement# 1, Info =0 
 *** Total elapsed time was 1 second.


 BTEQ -- Enter your SQL request or BTEQ command: 


 *** Table has been created. 
 *** Total elapsed time was 1 second.

Creamos el script de multiload:

.LOGTABLE CARLOS.PRUEBA_TEXT_LOG;

.LOGON MyTdpId/carlos,MyPassword;

.BEGIN IMPORT MLOAD TABLES CARLOS.PRUEBA_TEXT;

.DML LABEL INSERTAR_PRUEBA_TEXT;
INSERT INTO CARLOS.PRUEBA_TEXT VALUES(
	:id_n,
	:c_txt)
;

.LAYOUT INSERTAR;
	.FIELD id_n    1 CHAR(1);
	.FIELD c_txt   * CHAR(3);

.IMPORT INFILE Prueba.txt FORMAT TEXT
 LAYOUT INSERTAR
  APPLY INSERTAR_PRUEBA_TEXT;

.END MLOAD;

.LOGOFF;

Y lo ejecutamos. Acaba (sin errores):

...
     Target table 1: CARLOS.PRUEBA_TEXT
     Number of Rows        Error Table Name
     ====================  ==================================================
                        0  CARLOS.ET_PRUEBA_TEXT
                        0  CARLOS.UV_PRUEBA_TEXT

**** 19:19:13 UTY0817 MultiLoad submitting the following request:
     BEGIN TRANSACTION;
**** 19:19:13 UTY0817 MultiLoad submitting the following request:
     USING Ckpt(VARBYTE(1024)) INS CARLOS.PRUEBA_TEXT_LOG (LogType, Seq,
     MLoadCkpt)VALUES(140, 1, :Ckpt);
**** 19:19:13 UTY0817 MultiLoad submitting the following request:
     INS CARLOS.PRUEBA_TEXT_LOG (LogType, Seq) VALUES (125, 1)
**** 19:19:13 UTY0817 MultiLoad submitting the following request:
     END TRANSACTION;
**** 19:19:13 UTY0822 MultiLoad processing complete for this MultiLoad import
     task.
     ========================================================================
     =                                                                      =
     =          MultiLoad Task Complete                                     =
     =                                                                      =
     ========================================================================
**** 19:19:13 UTY1024 Session modal request, 'SET
     QUERY_BAND='UTILITYNAME=MULTLOAD;' UPDATE FOR SESSION;', re-executed.
     ========================================================================
     =                                                                      =
     =          Processing Control Statements                               =
     =                                                                      =
     ========================================================================

0011 .LOGOFF;
     ========================================================================
     =                                                                      =
     =          Logoff/Disconnect                                           =
     =                                                                      =
     ========================================================================
**** 19:19:14 UTY6216 The restart log table has been dropped.
**** 19:19:14 UTY6212 A successful disconnect was made from the RDBMS.
**** 19:19:14 UTY2410 Total processor time used = '0.265202 Seconds'
     .       Start : 19:19:04 - THU OCT 06, 2016
     .       End   : 19:19:14 - THU OCT 06, 2016
     .       Highest return code encountered = '0'.

Si vemos lo que hemos cargado:

 BTEQ -- Enter your SQL request or BTEQ command: 
SELECT * FROM CARLOS.PRUEBA_TEXT ORDER BY 1;


 *** Query completed. 2 rows found. 2 columns returned. 
 *** Total elapsed time was 1 second.

       ID_N  C_TXT
-----------  -----
          1  UNO
          2  DOS

Todo correcto, pues. Pero vamos a cambiar un poco el script de multiload. Vamos a cambiar en el LAYOUT el campo id_n de CHAR(1) a DECIMAL(1) (que también ocupa 1 byte):

.LOGTABLE CARLOS.PRUEBA_TEXT_LOG;

.LOGON MyTdpId/carlos,MyPassword;

.BEGIN IMPORT MLOAD TABLES CARLOS.PRUEBA_TEXT;

.DML LABEL INSERTAR_PRUEBA_TEXT;
INSERT INTO CARLOS.PRUEBA_TEXT VALUES(
	:id_n,
	:c_txt)
;

.LAYOUT INSERTAR;
	.FIELD id_n    1 DECIMAL(1);
	.FIELD c_txt   * CHAR(3);

.IMPORT INFILE Prueba.txt FORMAT TEXT
 LAYOUT INSERTAR
  APPLY INSERTAR_PRUEBA_TEXT;

.END MLOAD;

.LOGOFF;

Una nueva ejecución (otra vez sin errores):

     Target table 1: CARLOS.PRUEBA_TEXT
     Number of Rows        Error Table Name
     ====================  ==================================================
                        0  CARLOS.ET_PRUEBA_TEXT
                        0  CARLOS.UV_PRUEBA_TEXT

**** 19:22:08 UTY0817 MultiLoad submitting the following request:
     BEGIN TRANSACTION;
**** 19:22:08 UTY0817 MultiLoad submitting the following request:
     USING Ckpt(VARBYTE(1024)) INS CARLOS.PRUEBA_TEXT_LOG (LogType, Seq,
     MLoadCkpt)VALUES(140, 1, :Ckpt);
**** 19:22:08 UTY0817 MultiLoad submitting the following request:
     INS CARLOS.PRUEBA_TEXT_LOG (LogType, Seq) VALUES (125, 1)
**** 19:22:08 UTY0817 MultiLoad submitting the following request:
     END TRANSACTION;
**** 19:22:08 UTY0822 MultiLoad processing complete for this MultiLoad import
     task.
     ========================================================================
     =                                                                      =
     =          MultiLoad Task Complete                                     =
     =                                                                      =
     ========================================================================
**** 19:22:08 UTY1024 Session modal request, 'SET
     QUERY_BAND='UTILITYNAME=MULTLOAD;' UPDATE FOR SESSION;', re-executed.
     ========================================================================
     =                                                                      =
     =          Processing Control Statements                               =
     =                                                                      =
     ========================================================================

0011 .LOGOFF;
     ========================================================================
     =                                                                      =
     =          Logoff/Disconnect                                           =
     =                                                                      =
     ========================================================================
**** 19:22:09 UTY6216 The restart log table has been dropped.
**** 19:22:09 UTY6212 A successful disconnect was made from the RDBMS.
**** 19:22:09 UTY2410 Total processor time used = '0.296402 Seconds'
     .       Start : 19:22:00 - THU OCT 06, 2016
     .       End   : 19:22:09 - THU OCT 06, 2016
     .       Highest return code encountered = '0'.

Verificamos los datos en la tabla:

 BTEQ -- Enter your SQL request or BTEQ command: 
SELECT * FROM CARLOS.PRUEBA_TEXT ORDER BY 1;


 *** Query completed. 4 rows found. 2 columns returned. 
 *** Total elapsed time was 1 second.

       ID_N  C_TXT
-----------  -----
          1  UNO
          2  DOS
         49  UNO
         50  DOS

¡Hey! ¿Qué son ese 49 y ese 50? Pues ni más ni menos que los códigos decimales ASCII correspondientes a los dígitos ‘1’ y ‘2’. Al definir el campo (.FIELD) como DECIMAL(1) le hemos dicho que el dato que viene en el campo no es texto, sino un número, y multiload así lo hace: lee los BYTES como números y los carga en la tabla tal cual, sin interpretar el dato como la representación “en texto” de un número.

Pues sabiendo esto, y aunque no nos demos cuenta todavía, ahí está la clave para cargar los Comp-3 (Packed Decimals) en “mainframes“. La receta es fácil: si el dato numérico viene como texto (que será EBCDIC), bastará definir el .FIELD como CHAR(n) y multiload se encargará del CAST a numérico. Si por el contrario viene como “packed decimal” necesitaremos saber cuánto ocupa el campo en BYTES. En este caso también es necesario conocer el ‘PIC’ original. Así, por ejemplo:

PIC S9(4) COMP-3 => Byte size = (4 + 1) / 2 = 2.5 -> 3 bytes => .FIELD fld1 * DECIMAL(4)
PIC S9(5)V99 COMP-3 => Byte size = (5 + 2 + 1) / 2 = 4 bytes => .FIELD fld2 * DECIMAL(7,2)

Como se ve, el ‘PIC’ funciona de distinta manera que la definición de numéricos SQL: la parte entera se suma a la parte fraccionaria, mientras que en SQL la ESCALA supone el número total de dígitos, mientras que la PRECISIÓN dice cuántos de ellos son decimales.

Saludos.

Carlos.

Anuncios

2 respuestas a Cargar campos “COBOL Comp-3 (Packed Decimals)” con Multiload.

  1. […] con los campos “COBOL Comp-3 (Packed Decimals)” y Multiload, se nos ha presentado un problema a la hora de cargar ficheros en un HOST […]

  2. […] a los tipos COBOL ‘packed decimal’ que corresponden con tipos SQL DECIMAL(n, m), los tipos BINARY corresponden a tipos enteros SQL: […]

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s

A %d blogueros les gusta esto: