Cubo OLAP

format_list_bulleted Contenido keyboard_arrow_down
ImprimirCitar
Conjunto de datos multidimensional organizado para el análisis rápido
Un ejemplo de un cubo OLAP

Un cubo OLAP es una matriz multidimensional de datos. El procesamiento analítico en línea (OLAP) es una técnica informática para analizar datos para buscar información. El término cubo aquí se refiere a un conjunto de datos multidimensional, que a veces también se denomina hipercubo si el número de dimensiones es mayor que tres.

Terminología

Un cubo puede considerarse una generalización multidimensional de una hoja de cálculo bidimensional o tridimensional. Por ejemplo, una empresa podría desear resumir los datos financieros por producto, por período y por ciudad para comparar los gastos reales y presupuestados. Producto, tiempo, ciudad y escenario (real y presupuestado) son las dimensiones de los datos.

Cubo es una abreviatura de conjunto de datos multidimensional, dado que los datos pueden tener un número arbitrario de dimensiones. A veces se utiliza el término hipercubo, especialmente para datos con más de tres dimensiones. Un cubo no es un "cubo" en sentido matemático estricto, ya que los lados no son todos necesariamente iguales. Pero este término se usa ampliamente.

Un Sector es un término para un subconjunto de datos, generado al seleccionar un valor para una dimensión y mostrar solo los datos para ese valor (por ejemplo, solo los datos en un momento determinado). . Las hojas de cálculo son solo bidimensionales, por lo que mediante el corte (continuo) u otras técnicas, es posible visualizar datos multidimensionales en ellas.

Cada célula del cubo tiene un número que representa algunos Medida de la empresa, tales como ventas, ganancias, gastos, presupuesto y pronóstico.

Los datos OLAP normalmente se almacenan en un esquema de estrella o de copo de nieve en un almacén de datos relacional o en un sistema de gestión de datos de propósito especial. Las medidas se derivan de los registros de la tabla de hechos y las dimensiones se derivan de las tablas de dimensiones.

Jerarquía

Los elementos de una dimensión se pueden organizar como una jerarquía, un conjunto de relaciones padre-hijo, normalmente donde un miembro padre resume sus hijos. Los elementos principales se pueden agregar además como hijos de otro padre.

Por ejemplo, el padre de mayo de 2005 es el segundo trimestre de 2005, que a su vez es hijo del año 2005. De manera similar, las ciudades son hijos de regiones; los productos se dividen en grupos de productos y las partidas de gastos individuales en tipos de gastos.

Operaciones

Concebir los datos como un cubo con dimensiones jerárquicas conduce a operaciones conceptualmente sencillas para facilitar el análisis. Alinear el contenido de los datos con una visualización familiar mejora el aprendizaje y la productividad de los analistas. El proceso de navegación iniciado por el usuario solicitando visualizaciones de páginas de forma interactiva, mediante la especificación de cortes mediante rotaciones y profundización/arriba, a veces se denomina "cortar y cortar". Las operaciones comunes incluyen cortar y cortar en dados, profundizar, enrollar y girar.

OLAP slicing

Slice es el acto de seleccionar un subconjunto rectangular de un cubo eligiendo un valor único para una de sus dimensiones, creando un nuevo cubo con una dimensión menos. La imagen muestra una operación de corte: las cifras de ventas de todas las regiones de ventas y todas las categorías de productos de la empresa en los años 2005 y 2006 se "cortan" en forma de rebanadas. fuera del cubo de datos.

OLAP dicing

Dados: la operación de dados produce un subcubo al permitir al analista elegir valores específicos de múltiples dimensiones. La imagen muestra una operación de división: el nuevo cubo muestra las cifras de ventas de un número limitado de categorías de productos, las dimensiones de tiempo y región cubren el mismo rango que antes.

OLAP-functionalities
OLAP perforación y perforación

Drill Down/Up permite al usuario navegar entre niveles de datos que van desde los más resumidos (arriba) hasta los más detallados (abajo). La imagen muestra una operación desglosada: el analista pasa de la categoría de resumen "Equipo de protección exterior" para ver las cifras de ventas de los productos individuales.

Resumen: un resumen implica resumir los datos a lo largo de una dimensión. La regla de resumen podría ser una función agregada, como calcular totales a lo largo de una jerarquía o aplicar un conjunto de fórmulas como "beneficio = ventas - gastos". Las funciones de agregación generales pueden ser costosas de calcular cuando se acumulan: si no se pueden determinar a partir de las celdas del cubo, se deben calcular a partir de los datos base, ya sea computándolas en línea (lento) o precalculándolas para posibles despliegues (gran espacio). . Las funciones de agregación que se pueden determinar a partir de las celdas se conocen como funciones de agregación descomponibles y permiten un cálculo eficiente. Por ejemplo, es fácil admitir COUNT, MAX, MIN y SUM en OLAP, ya que se pueden calcular para cada celda del cubo OLAP y luego acumularlos. ya que la suma general (o recuento, etc.) es la suma de las subsumas, pero es difícil admitir MEDIAN, ya que debe calcularse para cada vista por separado: la mediana de un conjunto no es la mediana de medianas de subconjuntos.

OLAP pivoting

Pivote permite al analista rotar el cubo en el espacio para ver sus distintas caras. Por ejemplo, las ciudades podrían organizarse verticalmente y los productos horizontalmente mientras se visualizan los datos de un trimestre en particular. Pivotar podría reemplazar productos con períodos de tiempo para ver datos a lo largo del tiempo para un solo producto.

La imagen muestra una operación de pivote: se gira todo el cubo, lo que ofrece otra perspectiva de los datos.

Definición matemática

En teoría de bases de datos, un cubo OLAP es una representación abstracta de una proyección de una relación RDBMS. Dada una relación de orden N, considere una proyección que subtiende a X, Y y Z como la clave y W como atributo residual. Caracterizando esto como una función,

f#X,Y,Z) → W,

los atributos X, Y y Z corresponden a los ejes del cubo, mientras que W El valor corresponde al elemento de datos que puebla cada celda del cubo.

En la medida en que los dispositivos de salida bidimensional no pueden caracterizar fácilmente tres dimensiones, es más práctico proyectar "slices" del cubo de datos (dijimos proyecto en el clásico sentido analítico vectorial de la reducción dimensional, no en el sentido SQL, aunque ambos son conceptualmente similares),

g#X,Y) → W

que puede suprimir una clave primaria, pero aún tiene algún significado semántico, tal vez una porción de la representación funcional tríada para un valor Z de interés determinado.

La motivación detrás de las pantallas OLAP se remonta al paradigma del informe con tabulaciones cruzadas de los DBMS de la década de 1980 y a tablas de contingencia anteriores de 1904. El resultado es una visualización estilo hoja de cálculo, donde los valores de X rellena la fila $1; los valores de Y llenan la columna $A; y valores de g: (X, Y) → W rellenan las celdas individuales en las intersecciones de Columnas etiquetadas con X y filas etiquetadas con Y, "sureste", por así decirlo, de $B$2, con el propio $B$2 incluido.

Contenido relacionado

Encuadernación tardía

En informática, el enlace tardío o enlace dinámico es un mecanismo de programación informática en el que el método que se invoca en un objeto, o la...

Alma-0

Alma-0 es un lenguaje de programación informática multiparadigma. Este lenguaje es una versión aumentada del lenguaje imperativo Modula-2 con...

Tabla de métodos virtuales

En programación informática, una tabla de métodos virtuales una tabla de funciones virtuales, una tabla de llamadas virtuales , tabla de despacho, vtable o...

ALGOL Y

ALGOL Y fue el nombre dado a un sucesor especulado del lenguaje de programación ALGOL 60 que incorporaba algunas características radicales que fueron...

ALGOL 68S

ALGOL 68S es un lenguaje de programación diseñado como un subconjunto de ALGOL 68, para permitir la compilación mediante un compilador de un solo paso. Fue...
Más resultados...
Tamaño del texto:
undoredo
format_boldformat_italicformat_underlinedstrikethrough_ssuperscriptsubscriptlink
save