*El proceso de normalización de bases de datos consiste en aplicar una serie de reglas a las relaciones obtenidas tras el paso del modelo entidad-relación al modelo relacional.
Las bases de datos relacionales se normalizan para:
Evitar la redundancia de los datos.
Evitar problemas de actualización de los datos en las tablas.
Proteger la integridad de los datos.
En el modelo relacional es frecuente llamar tabla a una relación, aunque para que una tabla sea considerada como una relación tiene que cumplir con algunas restricciones:
Cada columna debe tener su nombre único.
No puede haber dos filas iguales. No se permiten los duplicados.
Todos los datos en una columna deben ser del mismo tipo.
Siempre que un analista de sistemas de base de datos arma una base de datos, queda a su cargo descomponer dicha base en grupos y segmentos de registros. Este proceso es la descomposición; el mismo es necesario independientemente de la arquitectura de la base de datos - relacional, red o jerárquica-. Sin embargo, para la base de datos relacional, la acción correspondiente puede dividirse y expresarse en términos formales y se denomina normalización a la misma.
La normalización convierte una relación en varias sub-relaciones, cada una de las cuales obedece a reglas. Estas reglas se describen en términos de dependencia. Una vez que hayamos examinado las distintas formas de dependencia, encontraremos procedimientos a aplicar a las relaciones de modo tal que las mismas puedan descomponerse de acuerdo a la dependencia que prevalece. Esto no llevará indefectiblemente a formar varias subrelaciones a partir de la única relación preexistente.
*La normalizacion sirve para clasificar relaciones y acciones dentro de una base de datos
*http://es.wikipedia.org/wiki/Normalizaci%C3%B3n_de_bases_de_datos
Primera forma normal
*La tabla se encuentra en 3FN si es 2FN y cada atributo que no forma parte de ninguna clave, depende directamente y no transitivamente, de la clave primaria. Un ejemplo de este concepto sería que, una dependencia funcional X→Y en un esquema de relación R es una dependencia transitiva si hay un conjunto de atributos Z que no es un subconjunto de alguna clave de R, donde se mantiene X→Z y Z→Y. Por ejemplo, la dependencia SSN→DMGRSSN es una dependencia transitiva en EMP_DEPT de la siguiente figura. Decimos que la dependencia de DMGRSSN el atributo clave SSN es transitiva vía DNUMBER porque las dependencias SSN→DNUMBER y DNUMBER→DMGRSSN son mantenidas, y DNUMBER no es un subconjunto de la clave de EMP_DEPT. Intuitivamente, podemos ver que la dependencia de DMGRSSN sobre DNUMBER es indeseable en EMP_DEPT dado que DNUMBER no es una clave de EMP_DEPT.
*También se usa en la normalización de base de datos, indica que una tabla esta en 3NF solo si se cumplen dos condiciones, una es qe este en 2NF y otra que dice que ningún atributo no primario de la tablaes dependiente de una clave candidata.
*http://www.mitecnologico.com/Main/FormasNormalesBasesDatos
*También se usa en la normalización de base de datos, indica que una tabla esta en 3NF solo si se cumplen dos condiciones, una es qe este en 2NF y otra que dice que ningún atributo no primario de la tablaes dependiente de una clave candidata.
*http://www.mitecnologico.com/Main/FormasNormalesBasesDatos
Segunda forma normal
*En Otras palabras pudiésemos decir que la segunda forma normal está basada en el concepto de dependencia completamente funcional. Una dependencia funcional X → Y es completamente funcional si al eliminar los atributos A de X significa que la dependencia no es mantenida, esto es que A Є X, (X – Ā) -x→ Y. Una dependencia funcional X→ Y es una dependencia parcial si hay algunos atributos A Є X que pueden ser removidos de X y la dependencia todavía se mantiene, esto es A Є X, (X – Ā) → Y . Por ejemplo {SSN,PNUMBER} → HOURS es completamente dependencia dado que ni SSN → HOURS ni PNUMBER → HOURS mantienen la dependencia. Sin embargo {SSN,PNUMBER} → ENAME es parcialmente dependiente dado que SSN→ENAME mantiene la dependencia.
*la segunda forma normal se basa en un concepto de dependencia funcional y debe pasar antes por la primera forma
*http://www.mitecnologico.com/Main/FormasNormalesBasesDatos
*la segunda forma normal se basa en un concepto de dependencia funcional y debe pasar antes por la primera forma
*http://www.mitecnologico.com/Main/FormasNormalesBasesDatos
Tercera forma normal
*Una tabla está normalizada en esta forma si todas las columnas que no son llave son funcionalmente dependientes por completo de la llave primaria y no hay dependencias transitivas. Una dependencia transitiva es aquella en la cual existen columnas que no son llave que dependen de otras columnas que tampoco son llave.
Cuando las tablas están en la Tercera Forma Normal se previenen errores de lógica cuando se insertan o borran registros. Cada columna en una tabla está identificada de manera única por la llave primaria, y no deben haber datos repetidos. Esto provee un esquema limpio y elegante, que es fácil de trabajar y expandir.
*La tercera forma normal ayuda para que la base de datos se vea mas limpia, y sin repeticiones, y sin que haya dependencias transitivas, eliminando tambien dependencia a las columnas que no son llave primaria.
*http://mygnet.net/articulos/mysql/182/
Cuando las tablas están en la Tercera Forma Normal se previenen errores de lógica cuando se insertan o borran registros. Cada columna en una tabla está identificada de manera única por la llave primaria, y no deben haber datos repetidos. Esto provee un esquema limpio y elegante, que es fácil de trabajar y expandir.
*La tercera forma normal ayuda para que la base de datos se vea mas limpia, y sin repeticiones, y sin que haya dependencias transitivas, eliminando tambien dependencia a las columnas que no son llave primaria.
*http://mygnet.net/articulos/mysql/182/
Ciclo de vida
*Las etapas del ciclo de vida de una aplicación de bases de datos son las siguientes:
Planificación del proyecto.
Definición del sistema.
Recolección y análisis de los requisitos.
Diseño de la base de datos.
Selección del SGBD.
Diseño de la aplicación.
Prototipado.
Implementación.
Conversión y carga de datos.
Prueba.
Mantenimiento.
Estas etapas no son estrictamente secuenciales. De hecho hay que repetir algunas de las etapas varias veces, haciendo lo que se conocen como ciclos de realimentación. Por ejemplo, los problemas que se encuentran en la etapa del diseño de la base de datos pueden requerir una recolección de requisitos adicional y su posterior análisis.
1. Planificación del proyecto
Esta etapa conlleva la planificación de cómo se pueden llevar a cabo las etapas del ciclo de vida de la manera más eficiente.
2. Definición del sistema
En esta etapa se especifica el ámbito y los límites de la aplicación de bases de datos, así como con qué otros sistemas interactúa
3. Recolección y análisis de los requisitos
En esta etapa se recogen y analizan los requerimientos de los usuarios y de las áreas de aplicación. Esta información se puede recoger de varias formas
4. Diseño de la base de datos
Esta etapa consta de tres fases: diseño conceptual, diseño lógico y diseño físico de la base de datos. La primera fase consiste en la producción de un esquema conceptual, que es independiente de todas las consideraciones físicas. Este modelo se refina después en un esquema lógico eliminando las construcciones que no se pueden representar en el modelo de base de datos escogido (relacional, orientado a objetos, etc.). En la tercera fase, el esquema lógico se traduce en un esquema físico para el SGBD escogido. La fase de diseño físico considera las estructuras de almacenamiento y los métodos de acceso necesarios para proporcionar un acceso eficiente a la base de datos en memoria secundaria.
5. Selección del SGBD
Si no se dispone de un SGBD, o el que hay se encuentra obsoleto, se debe escoger un SGBD que sea adecuado para el sistema de información. Esta elección se debe hacer en cualquier momento antes del diseño lógico.
6. Diseño de la aplicación
En esta etapa se diseñan los programas de aplicación que usarán y procesarán la base de datos. Esta etapa y el diseño de la base de datos, son paralelas.
7. Prototipado
Esta etapa, que es opcional, es para construir prototipos de la aplicación que permitan a los diseñadores y a los usuarios probar el sistema. Un prototipo es un modelo de trabajo de las aplicaciones del sistema.
8. Implementación
En esta etapa se crean las definiciones de la base de datos a nivel conceptual, externo e interno, así como los programas de aplicación. La implementación de la base de datos se realiza mediante las sentencias del lenguaje de definición de datos (LDD) del SGBD escogido
9. Conversión y carga de datos
Esta etapa es necesaria cuando se está reemplazando un sistema antiguo por uno nuevo. Los datos se cargan desde el sistema viejo al nuevo directamente o, si es necesario, se convierten al formato que requiera el nuevo SGBD y luego se cargan.
10. Prueba
En esta etapa se prueba y valida el sistema con los requisitos especificados por los usuarios. Para ello, se debe diseñar una batería de tests con datos reales, que se deben llevar a cabo de manera metódica y rigurosa. Es importante darse cuenta de que la fase de prueba no sirve para demostrar que no hay fallos, sirve para encontrarlos.
11. Mantenimiento
Una vez que el sistema está completamente implementado y probado, se pone en marcha.
*En resumen las etapas de este ciclo de vida son: Planificación del proyecto, definición del sistema, recolección y análisis de los requisitos,diseño de la base de datos,selección del SGBD,diseño de la aplicación, Prototipado,Implementación, Conversión y carga de datos, Prueba y Mantenimiento.
*http://www3.uji.es/~mmarques/f47/apun/node67.html
Planificación del proyecto.
Definición del sistema.
Recolección y análisis de los requisitos.
Diseño de la base de datos.
Selección del SGBD.
Diseño de la aplicación.
Prototipado.
Implementación.
Conversión y carga de datos.
Prueba.
Mantenimiento.
Estas etapas no son estrictamente secuenciales. De hecho hay que repetir algunas de las etapas varias veces, haciendo lo que se conocen como ciclos de realimentación. Por ejemplo, los problemas que se encuentran en la etapa del diseño de la base de datos pueden requerir una recolección de requisitos adicional y su posterior análisis.
1. Planificación del proyecto
Esta etapa conlleva la planificación de cómo se pueden llevar a cabo las etapas del ciclo de vida de la manera más eficiente.
2. Definición del sistema
En esta etapa se especifica el ámbito y los límites de la aplicación de bases de datos, así como con qué otros sistemas interactúa
3. Recolección y análisis de los requisitos
En esta etapa se recogen y analizan los requerimientos de los usuarios y de las áreas de aplicación. Esta información se puede recoger de varias formas
4. Diseño de la base de datos
Esta etapa consta de tres fases: diseño conceptual, diseño lógico y diseño físico de la base de datos. La primera fase consiste en la producción de un esquema conceptual, que es independiente de todas las consideraciones físicas. Este modelo se refina después en un esquema lógico eliminando las construcciones que no se pueden representar en el modelo de base de datos escogido (relacional, orientado a objetos, etc.). En la tercera fase, el esquema lógico se traduce en un esquema físico para el SGBD escogido. La fase de diseño físico considera las estructuras de almacenamiento y los métodos de acceso necesarios para proporcionar un acceso eficiente a la base de datos en memoria secundaria.
5. Selección del SGBD
Si no se dispone de un SGBD, o el que hay se encuentra obsoleto, se debe escoger un SGBD que sea adecuado para el sistema de información. Esta elección se debe hacer en cualquier momento antes del diseño lógico.
6. Diseño de la aplicación
En esta etapa se diseñan los programas de aplicación que usarán y procesarán la base de datos. Esta etapa y el diseño de la base de datos, son paralelas.
7. Prototipado
Esta etapa, que es opcional, es para construir prototipos de la aplicación que permitan a los diseñadores y a los usuarios probar el sistema. Un prototipo es un modelo de trabajo de las aplicaciones del sistema.
8. Implementación
En esta etapa se crean las definiciones de la base de datos a nivel conceptual, externo e interno, así como los programas de aplicación. La implementación de la base de datos se realiza mediante las sentencias del lenguaje de definición de datos (LDD) del SGBD escogido
9. Conversión y carga de datos
Esta etapa es necesaria cuando se está reemplazando un sistema antiguo por uno nuevo. Los datos se cargan desde el sistema viejo al nuevo directamente o, si es necesario, se convierten al formato que requiera el nuevo SGBD y luego se cargan.
10. Prueba
En esta etapa se prueba y valida el sistema con los requisitos especificados por los usuarios. Para ello, se debe diseñar una batería de tests con datos reales, que se deben llevar a cabo de manera metódica y rigurosa. Es importante darse cuenta de que la fase de prueba no sirve para demostrar que no hay fallos, sirve para encontrarlos.
11. Mantenimiento
Una vez que el sistema está completamente implementado y probado, se pone en marcha.
*En resumen las etapas de este ciclo de vida son: Planificación del proyecto, definición del sistema, recolección y análisis de los requisitos,diseño de la base de datos,selección del SGBD,diseño de la aplicación, Prototipado,Implementación, Conversión y carga de datos, Prueba y Mantenimiento.
*http://www3.uji.es/~mmarques/f47/apun/node67.html
Recoleccion y analisis de informacion
*Recolección de datos y análisis (Epi-Info)
Epi Info es un conjunto de programas de microcomputadora para manejar datos en formato de cuestionario y para organizar los resultados en texto que puede formar parte de informes escritos. Se puede confeccionar un cuestionario en pocos minutos, pero, a la vez, Epi Info puede ser la base para una poderosa base de datos de un sistema de vigilancia epidemiológica con muchos tipos de archivos y registros. Incluye los elementos más comúnmente utilizados por los epidemiólogos de programas estadísticos (como SAS o SPSS) y bases de datos (como dBASE) combinados en un sólo sistema. Al contrario que los programas comerciales Epi Info puede ser copiado libremente y regalado a amigos y colegas.
Hay tres niveles de aplicación de Epi Info para procesar cuestionarios u otros datos estructurados. Utilizado de la manera más simple, puede preparar un cuestionario o formulario en pocos minutos haciendo lo siguiente:
• Activar el menú principal. • Confeccionar un cuestionario con EPED, el procesador de textos. • Introducir datos con el programa ENTER. • Analizar los datos usando el programa ANALYSIS, produciendo listados, frecuencias, cruces, medias, gráficas o estadísticas complementarias.
A medida que conozca mejor el programa, podrá utilizar más prestaciones del programa e introducir o analizar datos de una manera más acorde a sus necesidades. Podría querer, en el segundo nivel de dificultad:
• Impedir errores al teclear datos, definir patrones de salto o hacer codificación automática. • Seleccionar registros, crear nuevas variables, recodificar y manipular datos y realizar operaciones condicionales durante el ANALYSIS. • Incorporar estas operaciones en programas que permitan realizarlas repetidamente o por otras personas no familiarizadas con la programación. • Importar y exportar archivos de otros sistemas, como SAS, SPSS, DBASE y Lotus 1-2-3. • Cambiar los nombres de las variables de los archivos usando CHECK.
El tercer nivel de dificultad es importante si quiere mantener un sistema permanente de datos, hacer un estudio amplio o adaptar las operaciones de Epi Info a necesidades especiales. Para tales propósitos, podría:
• Programar el procedimiento de introducción de datos para realizar operaciones matemáticas, depuración de errores, cambios de colores, ventanas desplegables y rutinas especiales escritas en otros lenguajes. • Especificar el formato de los informes desde ANALYSIS para producir tablas a medida. • Introducir datos en más de un archivo durante la misma sesión, moviéndose automáticamente entre varios cuestionarios dentro de ENTER. • Relacionar diferentes tipos de archivos en ANALYSIS, de forma que se puedan responder a cuestiones que requieran más de un archivo. • Comparar archivos duplicados introducidos por diferentes operadores para detectar errores en la introducción de datos. EPED, el editor incluido en la Versión 6, contiene un sistema para programar textos llamado EPIAID, que ayuda a estructurarlos. Se incluyen los programas para guiarle en la creación de cuestionarios y en el diseño de una investigación. El texto producido se puede utilizar como parte de un informe. Los programas de EPIAID pueden usarse para escribir cartas o informes con otros propósitos.
La Versión 6 contiene una serie de características nuevas, como un sistema de menús desplegables configurable, órdenes nuevas para la programación en ANALYSIS y ENTER, capacidad para ordenar y relacionar archivos muy grandes, un programa para analizar estudios a partir de muestras complejas, una calculadora epidemiológica nueva, y un programa para el procesamiento automatizado de datos antropométricos. Los archivos creados en las versiones previas de Epi Info se pueden usar en la versión 6. Los programas escritos en la Versión 5 pueden funcionar en la Versión 6 con muy pocas correcciones.
*Esta etapa de recoleccion y analisis nos sirve para seleccionar y revisar los datos que ponemos en la base de datos.
*http://www3.uji.es/~mmarques/f47/apun/node67.html
Epi Info es un conjunto de programas de microcomputadora para manejar datos en formato de cuestionario y para organizar los resultados en texto que puede formar parte de informes escritos. Se puede confeccionar un cuestionario en pocos minutos, pero, a la vez, Epi Info puede ser la base para una poderosa base de datos de un sistema de vigilancia epidemiológica con muchos tipos de archivos y registros. Incluye los elementos más comúnmente utilizados por los epidemiólogos de programas estadísticos (como SAS o SPSS) y bases de datos (como dBASE) combinados en un sólo sistema. Al contrario que los programas comerciales Epi Info puede ser copiado libremente y regalado a amigos y colegas.
Hay tres niveles de aplicación de Epi Info para procesar cuestionarios u otros datos estructurados. Utilizado de la manera más simple, puede preparar un cuestionario o formulario en pocos minutos haciendo lo siguiente:
• Activar el menú principal. • Confeccionar un cuestionario con EPED, el procesador de textos. • Introducir datos con el programa ENTER. • Analizar los datos usando el programa ANALYSIS, produciendo listados, frecuencias, cruces, medias, gráficas o estadísticas complementarias.
A medida que conozca mejor el programa, podrá utilizar más prestaciones del programa e introducir o analizar datos de una manera más acorde a sus necesidades. Podría querer, en el segundo nivel de dificultad:
• Impedir errores al teclear datos, definir patrones de salto o hacer codificación automática. • Seleccionar registros, crear nuevas variables, recodificar y manipular datos y realizar operaciones condicionales durante el ANALYSIS. • Incorporar estas operaciones en programas que permitan realizarlas repetidamente o por otras personas no familiarizadas con la programación. • Importar y exportar archivos de otros sistemas, como SAS, SPSS, DBASE y Lotus 1-2-3. • Cambiar los nombres de las variables de los archivos usando CHECK.
El tercer nivel de dificultad es importante si quiere mantener un sistema permanente de datos, hacer un estudio amplio o adaptar las operaciones de Epi Info a necesidades especiales. Para tales propósitos, podría:
• Programar el procedimiento de introducción de datos para realizar operaciones matemáticas, depuración de errores, cambios de colores, ventanas desplegables y rutinas especiales escritas en otros lenguajes. • Especificar el formato de los informes desde ANALYSIS para producir tablas a medida. • Introducir datos en más de un archivo durante la misma sesión, moviéndose automáticamente entre varios cuestionarios dentro de ENTER. • Relacionar diferentes tipos de archivos en ANALYSIS, de forma que se puedan responder a cuestiones que requieran más de un archivo. • Comparar archivos duplicados introducidos por diferentes operadores para detectar errores en la introducción de datos. EPED, el editor incluido en la Versión 6, contiene un sistema para programar textos llamado EPIAID, que ayuda a estructurarlos. Se incluyen los programas para guiarle en la creación de cuestionarios y en el diseño de una investigación. El texto producido se puede utilizar como parte de un informe. Los programas de EPIAID pueden usarse para escribir cartas o informes con otros propósitos.
La Versión 6 contiene una serie de características nuevas, como un sistema de menús desplegables configurable, órdenes nuevas para la programación en ANALYSIS y ENTER, capacidad para ordenar y relacionar archivos muy grandes, un programa para analizar estudios a partir de muestras complejas, una calculadora epidemiológica nueva, y un programa para el procesamiento automatizado de datos antropométricos. Los archivos creados en las versiones previas de Epi Info se pueden usar en la versión 6. Los programas escritos en la Versión 5 pueden funcionar en la Versión 6 con muy pocas correcciones.
*Esta etapa de recoleccion y analisis nos sirve para seleccionar y revisar los datos que ponemos en la base de datos.
*http://www3.uji.es/~mmarques/f47/apun/node67.html
Diseño conceptual
*En esta etapa se debe construir un esquema de la información que se usa en la empresa, independientemente de cualquier consideración física. A este esquema se le denomina esquema conceptual. Al construir el esquema, los diseñadores descubren la semántica (significado) de los datos de la empresa: encuentran entidades, atributos y relaciones. El objetivo es comprender:
La perspectiva que cada usuario tiene de los datos.
La naturaleza de los datos, independientemente de su representación física.
El uso de los datos a través de las áreas de aplicación.
El esquema conceptual se puede utilizar para que el diseñador transmita a la empresa lo que ha entendido sobre la información que ésta maneja. Para ello, ambas partes deben estar familiarizadas con la notación utilizada en el esquema. La más popular es la notación del modelo entidad-relación, que se describirá en el capítulo dedicado al diseño conceptual. El esquema conceptual se construye utilizando la información que se encuentra en la especificación de los requisitos de usuario. El diseño conceptual es completamente independiente de los aspectos de implementación, como puede ser el SGBD que se vaya a usar, los programas de aplicación, los lenguajes de programación, el hardware disponible o cualquier otra consideración física. Durante todo el proceso de desarrollo del esquema conceptual éste se prueba y se valida con los requisitos de los usuarios. El esquema conceptual es una fuente de información para el diseño lógico de la base de datos.
*Al realizar el esquema conceptual se descubre el significado de los datos que se tienen.
*http://www.mitecnologico.com/Main/Dise%F1oBasesDeDatos
La perspectiva que cada usuario tiene de los datos.
La naturaleza de los datos, independientemente de su representación física.
El uso de los datos a través de las áreas de aplicación.
El esquema conceptual se puede utilizar para que el diseñador transmita a la empresa lo que ha entendido sobre la información que ésta maneja. Para ello, ambas partes deben estar familiarizadas con la notación utilizada en el esquema. La más popular es la notación del modelo entidad-relación, que se describirá en el capítulo dedicado al diseño conceptual. El esquema conceptual se construye utilizando la información que se encuentra en la especificación de los requisitos de usuario. El diseño conceptual es completamente independiente de los aspectos de implementación, como puede ser el SGBD que se vaya a usar, los programas de aplicación, los lenguajes de programación, el hardware disponible o cualquier otra consideración física. Durante todo el proceso de desarrollo del esquema conceptual éste se prueba y se valida con los requisitos de los usuarios. El esquema conceptual es una fuente de información para el diseño lógico de la base de datos.
*Al realizar el esquema conceptual se descubre el significado de los datos que se tienen.
*http://www.mitecnologico.com/Main/Dise%F1oBasesDeDatos
Suscribirse a:
Entradas (Atom)