Recomendado, 2024

La Elección Del Editor

Diferencia entre la tabla de hechos y la tabla de dimensiones

La tabla de hechos y la tabla de dimensiones son los factores esenciales para crear un esquema . El registro de una tabla de hechos es una combinación de atributos de diferentes tablas de dimensiones. La tabla de hechos ayuda al usuario a analizar las dimensiones del negocio, lo que lo ayuda a tomar decisiones para mejorar su negocio. Por otro lado, las tablas de dimensiones ayudan a la tabla de hechos a recopilar las dimensiones a lo largo de las cuales se deben tomar las medidas.

El punto que distingue la tabla de hechos y la tabla de dimensiones es que la tabla de dimensiones contiene atributos a lo largo de los cuales se toman medidas en la tabla de hechos . Hay algunos otros factores que crean diferencias entre la Tabla de hechos y la Tabla de dimensiones para verlos, echemos un vistazo a la tabla de comparación que se muestra a continuación.

Gráfica comparativa

Bases para la comparaciónTabla de hechosTabla de dimensiones
BASICLa tabla de hechos contiene la medida a lo largo de los atributos de una tabla de dimensiones.La tabla de dimensiones contiene los atributos a lo largo de los cuales la tabla de hechos calcula la métrica.
Atributo y RegistrosLa tabla de hechos contiene menos atributos y más registros.La tabla de dimensiones contiene más atributos y menos registros.
Tamaño de la mesaLa tabla de hechos crece verticalmente.La tabla de dimensiones crece horizontalmente.
LlaveLa tabla de hechos contiene una clave principal que es una concatenación de claves primarias de todas las tablas de dimensiones.Cada tabla de dimensión contiene su clave principal.
CreaciónLa tabla de hechos solo se puede crear cuando se completan las tablas de dimensiones.Las tablas de dimensiones deben crearse primero.
EsquemaUn esquema contiene menos número de tablas de hechos.Un esquema contiene más número de tablas de dimensiones.
AtributosLa tabla de hechos puede tener datos tanto en formato numérico como textual.La tabla de dimensiones siempre contiene atributos en formato textual.

Definición de tabla de hechos

Una tabla de hechos es una tabla que contiene medidas a lo largo de los atributos de las tablas de dimensiones. Puede contener la información al nivel más bajo posible. Algunas tablas de hechos solo contienen datos de resumen, llamados Tabla de Datos Agregados . La tabla de hechos casi contiene los datos estampados en la fecha . Vamos a discutir las características de una tabla de hechos.

Llave concatenada
La tabla de hechos contiene una clave concatenada que es la concatenación de claves primarias de todas las tablas de dimensiones. La clave concatenada de la tabla de hechos debe identificar de forma única la fila en una tabla de hechos.

Grano de datos
El grano de datos muestra la profundidad con la que se almacenaron las mediciones en la tabla de hechos. El grano de datos debe estar en el nivel más alto posible.

Medidas aditivas
Los atributos de la tabla de hechos pueden ser totalmente aditivos o semi-aditivos . Las medidas totalmente aditivas son aquellas que pueden resumirse fácilmente para todas las dimensiones en la tabla de hechos. Por ejemplo, cantidad_ordenadas, es un atributo que se puede resumir para todas las dimensiones. Como, podemos tomar la cantidad total de pedidos, para un cliente particular, región, fecha, marca, etc. Las medidas semi-aditivas son aquellas que pueden sumarse a lo largo de algunas dimensiones de la tabla de hechos, pero no a todas las dimensiones. Al igual que, la cantidad de saldo no se puede resumir en la dimensión de tiempo, ya que cambia con el tiempo.

Datos escasos
A veces podemos ver los registros en la tabla de hechos que tiene atributos con medidas nulas . Por ejemplo, no puede haber ningún orden en un día festivo. Por lo tanto, los atributos para esta fecha tendrán medidas nulas. No tenemos que almacenar medidas para este tipo de registros, ya que no proporciona ninguna información.

Dimensiones degeneradas
A veces puede encontrar algunas dimensiones en la tabla de hechos, que no son en absoluto aditivas. Por ejemplo, order_number, customer_id, no puede agregar estos tipos de dimensiones. Sin embargo, en caso de que necesite encontrar un pedido realizado por un cliente en particular en este mes; entonces necesitará el customer_id para relacionar su búsqueda. Estos tipos si los atributos o dimensiones de la tabla de hechos se denominan Dimensión Degenerada .

Definición de la tabla de dimensiones

La tabla de dimensiones es un componente clave para el esquema de inicio. Una tabla de dimensiones contiene los atributos que representan las dimensiones, a lo largo de los cuales se realiza la medición en la tabla de hechos. Además, discutiremos algunas características de una tabla de dimensiones.

Atributos y claves
Cada tabla de dimensiones debe tener una clave principal que identifique de forma única cada registro de la tabla. Se observa comúnmente que la tabla de dimensiones contiene muchos atributos. Por lo tanto, parece ser ancho, es decir, cuando creas una tabla de dimensiones, la encontrarás extendiéndose horizontalmente .

Valores de atributo
Los valores de los atributos en la tabla de dimensiones rara vez son numéricos, la mayoría de las veces, los valores de los atributos están en formato textual . Por ejemplo, nombre del producto, marca, categoría, subcategoría, etc.

Relación entre atributos
Con frecuencia puede observar que los atributos con los que se encuentra en una tabla de dimensiones no están directamente relacionados. Como, Product_brand no tiene que hacer nada con package_date, pero ambos podrían ser los atributos de la tabla de dimensiones del producto.

Normalización
La tabla de dimensiones no se supone normalizada . Esto se debe a que la normalización de una tabla crearía muchas tablas intermedias. Cuando una consulta recoge un atributo de la tabla de dimensiones y recupera las mediciones a lo largo de la tabla de hechos, la consulta tiene que pasar por aquellas tablas intermedias que se vuelven ineficientes. Por lo tanto, las tablas de dimensiones no están normalizadas.

Perforando, enrollando hacia arriba
Los atributos de la tabla de dimensiones le permiten obtener los detalles, ya sea atravesando desde un nivel más alto de atributos agregados hasta atributos de nivel más bajo. Por ejemplo, si desea encontrar la venta total en una región, puede profundizar para encontrar las ventas por estado, ciudad, código postal. Incluso puede resumir para encontrar las ventas totales primero por código postal, luego por ciudad y luego por estado.

Jerarquía múltiple
A menudo la tabla de dimensiones ofrece múltiples jerarquías. Por ejemplo, tenemos una tabla de dimensiones de productos para una tienda departamental. Ahora, tenemos dos departamentos de marketing y departamento de contabilidad.

El departamento de marketing profundizará entre los atributos de la tabla de dimensiones del producto en una determinada jerarquía para obtener mediciones para la tabla de hechos.

Por otra parte, el departamento de contabilidad profundizará entre los atributos de la tabla de dimensiones del producto en la jerarquía diferente para obtener mediciones para la tabla de hechos.

Por lo tanto, la tabla de dimensiones debe tener múltiples jerarquías o nivel de agregación de atributos para que el usuario pueda profundizar en cualquiera de las múltiples jerarquías.

Archivos
Aunque una tabla de dimensiones tiene demasiados atributos, tiene menos registros.

Diferencias clave entre la tabla de hechos y la tabla de dimensiones

  1. La tabla de hechos contiene medidas a lo largo de la dimensión / atributos de una tabla de dimensiones.
  2. La tabla de hechos contiene más registros y menos atributos en comparación con la tabla de dimensiones, mientras que la tabla de dimensiones contiene más atributos y menos registros.
  3. El tamaño de la tabla de la tabla de hechos crece verticalmente, mientras que el tamaño de la tabla de la tabla de dimensiones crece horizontalmente.
  4. Cada tabla de dimensión contiene una clave principal para identificar cada registro en la tabla, mientras que la tabla de hechos contiene una clave concatenada que es una combinación de todas las claves principales de toda la tabla de dimensión.
  5. La tabla de dimensiones debe registrarse antes de la creación de la tabla de hechos.
  6. Un esquema contiene menos tablas de hechos pero más tablas de dimensiones.
  7. Los atributos en la tabla de hecho son numéricos y textuales, pero los atributos de la tabla de dimensiones solo tienen atributos textuales.

Conclusión:

Ambos son igual de importantes para la creación de un esquema, pero la tabla de dimensiones debe registrarse antes que la tabla de hechos. Como es imposible crear una tabla de hechos sin dimensiones.

Top