Pentaho

Solo disponible en BuenasTareas
  • Páginas : 5 (1249 palabras )
  • Descarga(s) : 10
  • Publicado : 26 de julio de 2010
Leer documento completo
Vista previa del texto
Analisis del estado de Mondrian (OLAP Open Source)
Autor: Javier Giménez Fecha creación: 21/05/2007 Última modificación: 21/05/2007

Analisis del estado de Mondrian

1.

Mondrian
1.1. ¿Qué es mondrian?

Mondrian, ahora rebautizado como Pentaho Analysis Services, es el motor OLAP integrado en la suite de Business Intelligence Open Source Pentaho. Mondrian es un proyecto Open Source,licenciado bajo la Mozilla Public License (MPL). Esta licencia es una de las “Business Friendly” lo cual implica que es de las menos restrictivas para su uso desde la mayor parte de los puntos de vista (al igual que la resto de la suite de Pentaho), permitiendo Modificar, Embeber, Modularizar, el software sin restricciones; dejando al parecer de la organización el aporte o no de los cambiosrealizados al proyecto. La página actual del proyecto (con la documentación) es: http://mondrian.pentaho.org/

1.1.1.

¿Que es OLAP?

Siglas de On-Line Analytical Process

1.2.

¿Cómo funciona mondrian?
Visión Global

1.2.1.

Mondrian es un motor ROLAP con caché, lo cual lo sitúa cerca del concepto de Hybrid OLAP. ROLAP significa que en mondrian no residen datos (salvo en la caché) sino queestos residen en una Sistema de Gestion de Bases de Datos externo. Es en esta base de datos en la que residen las tablas que conforman la información multidimensional con la que mondrian trabaja (los modelos en estrella de nuestros data marts por ejemplo). MOLAP es el nombre que reciben los motores olap en los que los datos residen en una estructura dimensonal. Mondrian se encarga de recibirconsultas dimensionales (lenguaje MDX) y devolver los datos de un cubo, sólo que este cubo no es algo físico sino un conjunto de metadatos que definen como se han de “mapear” estas consultas que tratan conceptos dimensionales a sentencias SQL ya tratando con

30/05/2007

www.stratebi.com

Pag. 2 de 6

Analisis del estado de Mondrian

conceptos relacionales que obtengan de la base de datos lainformación necesario para satisfacer la consulta dimensional. Algunas de las ventajas de este modelo son: El no tener que generar cubos estáticos ahorrando que cuesta generarlos y la memoria que ocupan La posibilidad de utilizar siempre los datos residentes en la base de datos, de forma que se trabaja con datos actualizados. Muy útil en entorno de BI Operacional. (ver punto 1.2.4 para ver comose relaciona esto con la caché). Pese a que tradicionalmente los sistemas MOLAP tienen una cierta ventaja de rendimiento, la aproximación híbrida de Mondrian, el uso de caché y de tablas agregadas, hace que se puedan obtener muy buenos rendimientos con él, sin perder las ventajas del modelo ROLAP clásico. Es muy importante aprovechar bien las ventajas de la base de datos donde residen las tablas.-

1.2.2.

Flujo de ejecución de mondrian

Veamos para que quede más claro un ejemplo de un flujo de ejecución de una consulta MDX contra mondrian: 1 – Un cliente (por ejemplo la interfaz web JPivot) lanza una consulta MDX contra mondrian, solicitando una serie de datos y hablando de concepto dimensionales (ej. “Quiero el gasto del ultimo año para todas las provincias”). 2 – Mondrianrecibe la sentencia MDX (referida a un cubo en concreto) busca en sus metadatos (esquema de mondrian, un fichero xml que define cubos) que conceptos relacionales (tablas, columnas) se asocian con estos conceptos dimensionales. Busca si ya tiene esos datos en la caché (los obtiene muy rápidamente), si los tiene los devuelve al interfaz, sino ejecuta el siguiente paso. 3 - Genera las sentencias SQLnecesarias (mirando en su esquema con la definición del cubo) para obtener esos datos. (ej. Una consulta SQL que obtiene los nombres de todas las provincias, otra que obtiene los gastos asociados a cada provincia ya agregados, etc...) 4 – La base de datos ejecuta las sentencias SQL (paso que más tiempo consume del proceso) y devuelve los datos a mondrian 5 – Mondrian almacena los datos recibidos en...
tracking img