En la actualidad, la infinidad de recursos y elementos tecnológicos esenciales en nuestro día a día trae como consecuencia la masificación creciente de datos que generan estas fuentes. 

Esta situación cambia el tablero del juego, llevando al éxito no únicamente a las empresas con mejor producto o financiación, sino también a las empresas que son capaces de extraer información relevante de esa ingente cantidad de datos, permitiendo tomar decisiones de negocio data-driven o basadas en los datos.

Un dato aislado es irrelevante para tomar decisiones. Para que este dato se convierta en información y conocimiento debe ser dotado de un contexto para ser comprendido. Aquí es donde las bases de datos juegan un papel fundamental. 

portada del post que es una base de datos

¿Qué son las bases de datos?

Una base de datos es un conjunto coordinado de información perteneciente al mismo contexto, organizada de tal forma que sea accesible y gestionada fácilmente.

A pesar de que comúnmente llamamos bases de datos a softwares como los de Oracle, SQL Server o MySQL, una base de datos no es un programa, es una agrupación de datos organizados a partir de ciertas reglas predefinidas. Estas aplicaciones que se acaban de nombrar son los sistemas de gestión de dichas bases de datos, y existe una gran variedad de estos sistemas en el mercado.

En conjunto, los datos y el sistema de gestión de la base de datos, junto con las aplicaciones que se relacionan con ellos, se aluden como un sistema de base de datos, frecuentemente abreviado como base de datos.

“Un dato aislado sin un contexto es irrelevante para la toma de decisiones.”

Los datos de las bases de datos más utilizadas hoy en día se presentan normalmente en líneas y segmentos en una progresión de cuadros para que la preparación y la consulta de los datos sean productivas. De esta manera, los datos podrían ser fácilmente accesibles, supervisados, modificados, actualizados, controlados y coordinados. La mayoría de las bases de datos utilizan un lenguaje de consulta estructurado para componer y consultar los datos.

Una base de datos no es una hoja en Excel

Una gran cantidad de profesionales utiliza las hojas de cálculo con funcionalidades propias de las bases de datos. Las hojas de cálculo estaban inicialmente destinadas a un cliente, y sus cualidades son un reflejo de eso. Son muy útiles para un cliente o un número modesto de clientes que no tienen que hacer un montón de control de datos en ocasiones confuso. 

Las bases de datos, por otra parte, están destinadas a contener un mayor surtido de datos coordinados y relacionados entre sí. Las bases de datos permiten a numerosos clientes acceder y consultar los datos de forma rápida y segura utilizando un lenguaje y una lógica en ocasiones compleja.

Tipos de bases de datos:

Cuando nos referimos al tipo de base de datos estamos hablando de su modelo de datos, es decir, la estructura lógica utilizada para construir esa base de datos. Es el sistema de gestión de bases de datos (comúnmente llamado DBMS por sus siglas en inglés de Database management system) el que nos permite estandarizar esas reglas y métodos para conformar la base de datos a través de un modelo u otro. A continuación detallaremos algunas de las bases de datos más utilizadas en la actualidad:

Relacionales

Las bases de datos relacionales son las más conocidas tanto por su amplia difusión como por su sencillez en la gestión y mantenimiento. Este tipo de base de datos caracteriza las conexiones de la base de datos como tablas conformando una estructura lógica uniforme y comprensible.

El modelo relacional se basa en la estructuración predefinida de relaciones entre puntos de datos de las tablas y utilizando claves (registros únicos en cada tabla) para conformar la estructura de conexiones. En la fase de diseño previa, se deben plantear una serie de reglas definidas de integridad de los datos para garantizar que sea esta base de datos sea accesible, escalable, rápida y precisa.

Algunas de las bases de datos más conocidas son Microsoft SQL Server, Oracle Database, MySQL e IBM DB2.

El lenguaje utilizado para comunicarnos con las bases de datos relacionales es el Lenguaje de Consulta Estructurado (SQL o Structured Query Language). Las sentencias SQL tienen numerosas funcionalidades para incluir, actualizar, analizar o eliminar información (Lo que en informática se conoce como CRUD)

“En informática, las siglas CRUD se refieren a las acciones Create, Read, Update and Delete.”

No Relacionales

Las bases de datos no relacionales o NoSQL surgen como respuesta a limitaciones de las bases de datos con modelos relacionales. Estas bases de datos no siguen el esquema tradicional de filas y columnas que hemos visto antes. El formato utilizado para almacenar datos en un modelo no relacional es el JSON.

“NoSQL significa Not only SQL, es decir, no únicamente SQL.”

La principal ventaja del modelo no relacional es su simplicidad a la hora de configurar el diseño al no tener un esquema predefinido tan inflexible como el modelo relacional. El equipo que confecciona la base de datos no tiene que preocuparse por establecer las relaciones entre los datos de las tablas ni su rendimiento, ya que las consultas en una base de datos NoSQL son mucho más rápidas. 

Las bases de datos NoSQL más populares son MongoDB, Cassandra, Neo4j o Document DB.

Diferencia entre un modelo relacional y no relacional en base de datos

Orientadas a Objetos

El concepto del diseño de este tipo de bases de datos proviene de la programación orientada a objetos (POO). En líneas generales, una base de datos orientada a objetos es un cruce entre los principios de procesamiento de datos de las bases de datos relacionales y el paradigma de POO.

Este modelo utiliza las entidades como objetos con un identificador único, teniendo propiedades y métodos como si de programación se tratase. También se incluye el concepto de clase como colección de objetos con las mismas características.

Una de las grandes ventajas de este modelo es la reducida brecha semántica. Los conceptos de POO permiten establecer objetos como representaciones de entidades con determinadas propiedades, asemejando el modelo la realidad y facilitando enormemente su diseño y comprensión.

La unión de POO y el modelo relacional dan como resultado las bases de datos orientadas a objetos.”

Orientadas a Grafos

En el diseño de grafos, la importancia de las relaciones es equiparable a la de los propios datos almacenados. Este tipo de bases de datos utiliza nodos como entidades o atributos conceptualmente similares a los objetos del tipo anterior. Cada uno de los nodos o vértices del modelo se comunica a través de aristas que relacionan dos nodos.

La utilización de este tipo de bases de datos ha ido aumentando exponencialmente a medida que las aplicaciones han requerido modelos más flexibles y adaptados a sus necesidades de negocio. Un claro ejemplo son las redes sociales que contienen una gran cantidad de información de interacciones entre diferentes usuarios, como una arista uniendo dos nodos. Los grafos son potentes precisamente en este tipo de casuísticas, en las que las empresas pueden utilizar dicha información para implementar algoritmos de recomendaciones personalizadas, sugerencias de amistad, etc.

A continuación, se representa un ejemplo muy básico de Grafos con varios nodos representando a usuarios y productos y sus conexiones o aristas representando la interacción entre ellos:

Ejemplo base de datos grafos

Elementos de una base de datos:

La correcta elección y configuración de cada elemento determinará si la base de datos cumple con los objetivos para los que fue diseñada o, en cambio, se convierte en un sistema ineficiente. Los recursos destinados a cada elemento dependerán en gran medida del tipo de base de datos y su modelo seleccionado en la fase de diseño. Aún así, hay una serie de elementos comunes en toda implementación:

Software

Entendemos el Software como el conjunto de programas utilizados para controlar y tratar la base de datos. Esto incorpora la propia programación del DBMS, el Sistema Operativo, la programación de la red que se utiliza para compartir los datos entre los clientes y los programas de aplicación utilizados para acceder a los datos en la DBMS.

Hardware

El hardware es la parte física de la base de datos. Comprende una gran cantidad de aparatos electrónicos como los ordenadores, los discos duros, servidores, etc.

Datos

Como es obvio, una base de datos no tiene sentido si no tenemos datos como recurso para almacenar. Una base de datos almacena dos tipos de datos: los datos operativos y los metadatos. Los datos operativos se refieren a aquella información que incluimos para almacenar y los metadatos en la información que nos permite comprender lo que se ha almacenado.

En las bases de datos es una práctica común y recomendable incluir un diccionario de datos, es decir, un conjunto de metadatos que brindan lógica y comprensión a los datos almacenados para evitar errores e interpretaciones confusas.

DMBS

Llamamos Sistema de administración de Bases de Datos o DMBS (DataBase Management System) a un programa o conjunto de programas que sirve para acceder y gestionar nuestras bases de datos. No es ni más ni menos que el software que sirve como enlace de comunicación entre nuestros datos y cualquier programa informático que trabaje con ellos.

Lenguaje de acceso

Se utiliza para acceder a los datos normalmente desde la interfaz del propio DBMS. Con el lenguaje podemos introducir nuevos datos, actualizar los ya existentes, programar acciones y prácticamente cualquier tarea requerida en la que intervengan los datos.

El lenguaje de comunicación con la base de datos más utilizado es SQL, aunque cada sistema de gestión de bases de datos tiene sus variaciones. Por ejemplo, Microsoft SQL Server utiliza Transact-SQL (T-SQL), una expansión de SQL desarrollada por IBM.

Procedimientos

Por procedimientos entendemos al conjunto de instrucciones que se utilizan para configurar el DMBS y su correcto funcionamiento, así como sus accesos y copias de seguridad, etc.

Reporting

El generador de informes es un programa que extrae la información de la base de datos y la representa visualmente en el formato configurado previamente para ser consumido por los analistas o diferentes miembros de la organización.

También puede interesarte…