Almacén de datos para las sesiones del Poder  Legislativo
  
  Data  warehouse for the legislative branch sessions
Josué Martin Silva Guerrero
Instituto Tecnológico de  Colima, México 
josue226@gmail.com
Nicandro Farías Mendoza 
  Instituto Tecnológico de  Colima, México 
  nfarias@itcolima.edu.mx 
                                                                                  Noel García Díaz  
  Instituto Tecnológico de  Colima, México 
  ngarcia@itcolima.edu.mx 
  Resumen
  El Poder Legislativo de los estados a través  de los H. Congresos estatales celebra sesiones de carácter obligatorio al menos  una vez a la semana de acuerdo a las leyes estatales. La celebración de dichas  sesiones se hace de acuerdo a un procedimiento específico plasmado en un  documento denominado “Orden del día”, con la finalidad de dejar evidencia sobre  el desarrollo de la sesión en otro documento denominado “Diario de debates”.
El Congreso del Estado de Colima ha  publicado en su sitio web las sesiones de las últimas seis legislaturas, sin  embargo, dichas sesiones se presentan de manera desarticulada, haciendo  ineficiente el proceso de recuperación de información relevante para el  usuario. La presente investigación propone construir una estructura denominada  almacén de datos que articule las sesiones de las diversas legislaturas. Con  ella se podrán realizar consultas avanzadas mediante el portal web de la  institución. 
Palabras clave: almacén de datos, conversión de datos, recuperación de información, Gobierno.
Abstract
  The  Legislative Branch of the States through the Meritorious State Congresses held  mandatory sessions at least once a week according to State laws. These sessions  are meet according to a specific procedure embodied in a document entitled  "Draft agenda", in order to leave evidence on the development of the  session in another document called "Journal of debates". 
The  Congress of the State of Colima has published on its website the sessions of  the last six legislatures, however, these sessions appear to be disjointed,  inefficient making the process of retrieval of relevant information for the  user. This research proposes to build a structure called data warehouse that  articulates the different legislative sessions. With this you can make an  advanced enquiry through the institution website. 
Key words: data warehouse, data conversion, retrieval of  information, Government.  
Fecha recepción: Septiembre 2015 Fecha aceptación: Enero 2016
Introducción
  De acuerdo  al artículo 13 de la Ley de transparencia y acceso a la información pública del  estado, está estipulado que: “Los sujetos obligados a que se refiere la  presente Ley deberán poner a disposición del público, difundir y actualizar, en  forma permanente y por Internet…” [1] Por tal motivo, es obligación del H.  Congreso del Estado estar almacenando en su sitio web información generada por  el mismo para poder brindar a la población acceso a la información. 
  El actual número  de sesiones y la información generados en el H. Congreso del Estado son muy  extensos, lo cual genera numerosos documentos a lo largo de los meses. Si se  toma en cuenta que la información se almacena de manera aislada y que es mucho tiempo  el que se requiere para buscar la información, se puede ver que el método resulta  ineficiente, volviendo tediosa la búsqueda de información e innecesarios los  gastos en tiempo y dinero.
La figura 1  muestra el procedimiento que sigue el H. Congreso del Estado actualmente para  la expedición de sus documentos y su metodología para integrar dicha  documentación en su sitio web.
Figura 1. Modelo de los procesos actuales del H. Congreso
Para entender mejor dicho modelo se describe  cada una de sus partes, así como los usuarios que interactúan en dicho proceso.
  Comisión de Gobierno Interno.- La Comisión de Gobierno es presidida por el Coordinador del Grupo  Parlamentario, quien por sí solo representa a la mayoría absoluta; las Secretarías  están ocupadas por los Coordinadores de los Grupos Parlamentarios que ocupan el  segundo y tercer lugar de acuerdo al número de diputados que representan; los demás  coordinadores tienen el carácter de vocales.
  La Comisión de Gobierno se reúne por lo  menos una vez a la semana, durante los periodos ordinarios de sesiones; y fuera  de estos las veces que sean necesarias. Las reuniones son convocadas por  escrito con 24 horas de anticipación, por el Presidente de la Comisión y deben contener  la propuesta de asuntos a tratar en la orden del día [2].
Orden del día [2]: toda sesión se sujeta a  un orden del día que debe ser aprobado por la Asamblea y que, en el caso de las  sesiones ordinarias, contiene al menos los siguientes puntos:
I.- Lectura del proyecto  de orden del día; 
  II.- Lista de  asistencia; 
  III.-  Declaración, en su caso, de quedar legalmente instalada la sesión y ser válidas  las resoluciones que en ella se tomen;
  IV.-  Discusión y aprobación del acta de la sesión anterior, o en su caso propuesta  de dispensa de lectura, siempre y cuando haya sido distribuida previamente a  los diputados;
  V.- Síntesis de  comunicaciones y el trámite que corresponda a cada uno de los documentos y  asuntos leídos, o en su caso propuesta de dispensa de lectura;
  VI.-  Presentación de dictámenes: lectura, discusión y votación de los mismos, en su  caso; 
  VII.- Asuntos generales;
  VIII.- Convocatoria para  la próxima sesión; y
  IX.- Clausura [2].
Diario de los debates y actas.- El Congreso edita el Diario de los Debates, que tiene por objeto la conservación y  archivo de la historia del proceso legislativo estatal.
  El Diario  de los Debates contiene el lugar y la fecha en los que se llevan a cabo las  sesiones, el orden del día, los nombres de los diputados que integran la directiva,  la trascripción íntegra de la grabación digitalizada de las deliberaciones en  el orden en que se desarrollan, así como la inserción de los documentos que se  presentan en el transcurso de la misma, pero en ningún caso deben publicarse  los documentos y discusiones relacionados con las sesiones secretas que se  verifiquen [2].
  En el modelo mostrado se pueden observar  varios usuarios, quienes tienen tareas específicas que van desde la generación  de los documentos hasta la integración de los mismos en el sitio web.
  Administrador.- Es el encargado de recolectar la información emitida para, una vez  obtenida, subirla al servidor para que sea visualizada en el sitio web de la  institución.
  Usuario final.- Es la persona interesada en la documentación emitida por el Congreso  del Estado, la cual puede consultar directamente en el sitio web de la  institución.
  El problema con la actual metodología que  sigue la institución está en que toda la información va siendo apilada, así que  en el momento que el usuario final la requiere tiene que buscar de manera  manual, recorriendo la colección de archivos hasta encontrar el de su interés, en  una búsqueda exhaustiva y aburrida.
MATERIAL Y MÉTODOS
Para solventar las situaciones anteriores se propone un almacén de datos que mediante unos formatos articula la información generada para permitir al usuario final realizar consultas avanzadas y obtener la información de una manera más rápida y eficiente. Dicha propuesta se muestra en la figura 3, donde una línea roja la separa de los procesos que actualmente se siguen.
Figura 2 Modelo conceptual del almacén de datos
A continuación se describe  cada parte de este mapa conceptual.
  Información  desarticulada.- Aquí es necesario saber cómo se encuentra la información  antes de que sea procesada.
  El H. Congreso del Estado  celebra sesiones semanales, generando una gran cantidad de información que por  ley tiene que hacerse pública a través de su sitio web.
  La documentación generada a  través de las actas de las sesiones y las órdenes del día es capturada en documentos  Word, convertida después a formato PDF, y finalmente almacenada en el sitio web  mediante un sistema llamado SACE, que actualmente se encuentra en operación.
  Es muy sencilla la manera como  se agrega la información; únicamente se ingresa el nombre identificador del  documento así como sus respectivos documentos (PDW, WORD), apilando la  información conforme se agregan nuevos. 
  La desventaja que tiene está  información apilada y desarticulada es que al momento de consultar sesiones  pasadas se debe hacer una por una, es decir, si se desea consultar una sesión  del día 09 de junio del año 2013, se debe entrar a la sección de dicho año y buscar  mes con mes en la página hasta encontrar el día deseado. 
  Dicha forma de consulta requiere  mucho tiempo y el usuario inexperto puede en determinado momento desesperarse y  optar por conseguir la información por otras vías, como pueden ser la  telefónica, electrónica o presencial. 
  Proceso  de conversión y formato.- Para articular la información es necesario crear una  estructura que sirva de puente entre la información desarticulada y el  almacenamiento. Para ello se utiliza una plataforma web, la cual contiene los  elementos esenciales de la documentación presentada para que a través de ella  se pueda filtrar la información y posteriormente almacenarla en una base de  datos (almacén de datos).
  La plataforma se desarrolla  en un lenguaje de programación denominado PHP, utilizado para realizar  contenido dinámico en un entorno web.
  Se codifica en un framework  llamado Codeigniter para conseguir una mejor estructura y orden en el  desarrollo, y se aprovecha su potencial para un software más estable, íntegro y  seguro.
  Las interfaces visuales se  desarrollan utilizando Bootsrap[3], un framework muy popular en HTML, CSS y  JavaScript para desarrollo responsivo o adaptable a las pantallas utilizadas.
El  formato consiste en una serie de elementos que captura el administrador:
Con  la información presentada se logra capturar la información de las actas de las  sesiones y a partir de ahí obtener la orden del día. De esa manera también se  consigue articular la información, la cual posteriormente se guarda en el  almacén de datos:
  Almacén de  datos (Base de datos).- El almacén de datos no es otra  cosa a nivel estructural que una base de datos, la cual contiene toda la  información actual e histórica de las sesiones celebradas en el Congreso de  Estado.
  A  continuación se muestran breves reseñas históricas de los almacenes de datos.
  Un  Almacén de Datos, también conocido como Data Warehouse, es una base de datos  accesible por los usuarios con un registro de datos históricos y actuales  acerca de todas las entidades importantes que se encuentran en la institución.
  El  almacén de datos organiza y aloja los datos necesarios, para ser utilizados en  un proceso analítico dentro de una perspectiva de tiempo.
  Según  Ralph Kimball y Bill Inmon, un Almacén de datos es:[4]
  “Una  copia de la transacción de datos específicamente estructurado para consulta y  análisis”.
  “Orientado  al tema, integrado, de tiempo variante, de colección de datos no volátil en  apoyo a la gestión del proceso de toma de decisiones”.
  Existen  diferentes razones que justifican la creación de un almacén de datos para  obtener la información necesaria en el proceso de almacenaje de las sesiones  celebradas en el H. Congreso del Estado, en lugar de extraer dicha información  directamente de las bases de datos de las aplicaciones relacionales.
  •Rendimiento.- El tiempo que tarda en acceder a los datos del repositorio del almacén  de datos es menor que el hacer una consulta a diferentes bases de datos. Además  el  hacer consultas complejas a la base  de datos operacionales empeora el tiempo de respuesta de estos sistemas para  otros usuarios.[5]
  •Limpieza de datos.- Para tener datos homogeneizados es necesario hacer una limpieza de  datos mediante técnicas o herramientas adecuadas para lograr la estandarización  de los datos. [5]
  •Ajustes.- En ocasiones se hace necesario un ajuste de los datos para posibles  comparaciones. [5] 
  •Periodicidad.- La periodicidad puede ser distinta, diaria, semanal, mensual, etcétera.  Como en los casos anteriores para posibles comparaciones, es necesaria la  homogeneización ya realizada en el DW. [5]
  •Datos históricos.- Los datos históricos no se suelen guardar en los sistemas  operacionales, pero son un elemento esencial de cualquier análisis. El DW es el  lugar adecuado para estos datos. [5]
Para el desarrollo del almacén de datos del proyecto se utilizará una herramienta basada en Mysql llamada Workbench, que es una herramienta visual unificada para el desarrollo y administración de arquitecturas de bases de datos. A continuación en la siguiente imagen (figura 2) se muestra el almacén de datos realizado para este proyecto, el cual contiene cada uno de los elementos necesarios para el almacenamiento de cada sesión legislativa.
Figura 3 Diagrama de clases para Almacén de datos del H. Congreso del Estado
Información  articulada.- A través del formato y estructura presentados  tendremos la capacidad de articular la información plana de la que se dispone  al inicio. En el momento que se almacene podrá ser flexible para que el usuario  final con una única consulta pueda obtener dicha información.
La  información articulada es la integración de todos esos datos ligados entre sí  para que en el momento que el usuario introduzca mínimos datos para su búsqueda,  el almacén de datos pueda ubicar la información y arrojar como resultado toda  la información relacionada.
RESULTADOS Y  CONCLUSIONES
  Interfaces finales
A  continuación se muestran algunas interfaces, resultados y planos que se  generaron para el sistema integral que se encarga de almacenar la información  en la base de datos, para que posteriormente sea visualizada en el sistema y  sitio web desarrollados.
Las siguientes imágenes (figuras 4 y 9) forman parte del formato de captura que se generó para almacenar las actas y órdenes del día que el Congreso del Estado celebra. Fueron divididas en cinco partes para hacer su captura más cómoda al usuario.
Figura 4 Pantalla de inicio de sesión
Figura 5 Formato de captura de actas parte 1
Figura 6 Formato de captura de actas parte 2
Figura 7 Formato de captura de actas parte 3
Las figuras 5, 6, 7, 8 y 9 muestran algunas actividades que el sistema permite al usuario para almacenar y recuperar las actas en el almacén de datos del sistema.
Figura 8 Formato de captura de actas parte 4
Figura 9 Formato de captura de actas parte 5
Las imágenes que se muestran a continuación son algunas de las interfaces para realizar las consultas, así como los resultados arrojados (figuras 10 y 11).
Figura 10 Interfaz de búsqueda de actas
Figura 11 Resultado de consulta parte 1
La figura 11 muestra el resultado de la consulta de las actas almacenadas; el reporte presentado muestra los datos que permiten caracterizar el acta específica, así como el orden del día del acta referida.
Figura 12 Resultado de consulta parte 2
Como  se pudo observar en las imágenes anteriores, podemos obtener resultados de las  sesiones almacenadas simplemente con agregar un campo en la búsqueda.
  Actualmente  los resultados se imprimen directamente en HTML.
  Conclusión
  Como  se puede ver en las imágenes, tanto el almacenamiento de información como la  realización de consultas son agradables y sencillos para el usuario final, con  una estructura sólida en el almacén de datos que brinda una buena articulación de  la información.
  En  consecuencia, el proceso de búsquedas concretas puede realizarse de manera  rápida, aumentando la eficacia de transparencia del sitio web de la  institución.
El  objetivo de la presente investigación se cumplió satisfactoriamente al tomarse en  cuenta los resultados obtenidos. 
Limitaciones.- A continuación se muestran los alcances que definen los límites del proyecto, los cuales en un futuro se pueden ampliar dependiendo de su desarrollo.
Alcances.- Dentro del desarrollo del proyecto existe un rango de lo que se puede hacer y de lo que no. A continuación se definen los alcances fijados.
Recomendaciones
  Para  continuar con esta investigación en un futuro se hacen las siguientes  recomendaciones:
Bibliografía
  H. Congreso del Estado de Colima (2013). Ley de Transparencia y Acceso a  la Información Pública. 
  H. Congreso del Estado de Colima. Reglamento de la Ley Orgánica del  Poder Legislativo del Estado Libre y Soberano de Colima.
  Bootstrap. The world’s most popular mobile-first and responsive  front-end framework. Getbootstrap.com.N.p.2015.
Inmon, William H. (1996). Building the Data Warehouse, Wiley Computer,  New York.
Torres Visitación, Graud Mar, Soldado Rosana. Bases de datos y  datawarehouse: herramientas estratégicas para la eficacia comercial.  Universidad de Granada.