Cloudera Data Visualizations - 10% Flashcards

(27 cards)

1
Q

Un analista de datos necesita crear un informe para el equipo de marketing que permita monitorizar en tiempo real los KPIs (Key Performance Indicators) de la última campaña. ¿Cuál es la función principal de un Dashboard en Cloudera Data Visualizations para este escenario?

A) Permitir la descarga masiva de los datos brutos de la campaña para un análisis externo.
B) Proporcionar una vista consolidada y visual de los principales indicadores de rendimiento para facilitar la toma de decisiones rápida.
C) Servir como una interfaz para que los ingenieros de datos ejecuten consultas SQL complejas de forma programada.
D) Administrar los permisos de acceso a las tablas de datos subyacentes utilizadas en la campaña.

A

B) Proporcionar una vista consolidada y visual de los principales indicadores de rendimiento para facilitar la toma de decisiones rápida.

La esencia de un Dashboard es transformar datos en información visual y fácilmente digerible. Su propósito principal es presentar una vista consolidada de métricas y KPIs clave para que los stakeholders (en este caso, el equipo de marketing) puedan entender el rendimiento de un vistazo y tomar decisiones informadas rápidamente sin necesidad de analizar los datos brutos.

Incorrectas:

A) Permitir la descarga masiva de los datos brutos de la campaña para un análisis externo

Aunque es posible exportar datos desde algunas visualizaciones, la función principal de un dashboard no es la descarga masiva de datos brutos. Para eso existen otras herramientas y métodos más eficientes.

C) Servir como una interfaz para que los ingenieros de datos ejecuten consultas SQL complejas de forma programada

La ejecución de consultas SQL es realizada por motores como Hive o Impala. Los dashboards consumen los resultados de estas consultas, pero no son la interfaz principal para su ejecución o programación por parte de los ingenieros.

D) Administrar los permisos de acceso a las tablas de datos subyacentes utilizadas en la campaña

La administración de permisos de acceso a los datos es una función de gobierno de datos, gestionada principalmente por herramientas como Apache Ranger, no por la herramienta de visualización en sí.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Se te ha pedido que crees un informe visual para el equipo de marketing que muestre la proporción de ventas que cada categoría de producto representa sobre el total de ventas en el último trimestre. El objetivo es ver rápidamente qué categorías son las más importantes.

¿Qué tipo de gráfico en Cloudera Data Visualizations sería el más adecuado para esta tarea?

A) Gráfico de líneas (Line Chart)
B) Gráfico circular (Pie Chart)
C) Gráfico de dispersión (Scatter Plot)
D) Mapa de calor (Heatmap)

A

B

Respuesta y Explicación:

Respuesta Correcta: B) Gráfico circular (Pie Chart)

Por qué es correcta: Un gráfico circular está diseñado específicamente para mostrar la composición de un todo. Cada “porción” del círculo representa una categoría y su tamaño es proporcional a su contribución al total (100%). Esto permite al equipo de marketing ver de un vistazo qué categorías de productos dominan las ventas.

Por qué las otras son incorrectas:

A) Gráfico de líneas: Es ideal para mostrar tendencias a lo largo del tiempo (por ejemplo, ventas por mes), no para mostrar proporciones en un único punto en el tiempo.

C) Gráfico de dispersión: Se utiliza para identificar la relación o correlación entre dos variables numéricas (por ejemplo, precio vs. cantidad vendida), no para mostrar partes de un todo.

D) Mapa de calor: Es útil para visualizar la magnitud de un fenómeno en una matriz de dos dimensiones, como la intensidad de ventas por día de la semana y hora del día. No es adecuado para mostrar una simple composición porcentual.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Estás construyendo un nuevo dashboard en Cloudera Data Visualizations para analizar las tendencias de ventas trimestrales por región. ¿Qué tipo de visualización sería más efectiva para comparar el rendimiento de las ventas entre diferentes regiones a lo largo del tiempo y, al mismo tiempo, mostrar la composición de las ventas por categoría de producto dentro de cada región?

a) Un gráfico de dispersión (Scatter Plot) con las regiones en el eje X y las ventas en el eje Y.

b) Un gráfico de barras apiladas (Stacked Bar Chart) con el tiempo en el eje X, las ventas en el eje Y y las regiones apiladas por color.

c) Un mapa de calor (Heatmap) que muestre la intensidad de las ventas por región y mes.

d) Un gráfico de barras agrupadas (Grouped Bar Chart) con las regiones en el eje X y barras separadas para cada trimestre.

A

B

Explicación:

Correcta: Un gráfico de barras apiladas es ideal para esta tarea. Permite mostrar una variable principal (ventas totales) a lo largo de una dimensión (tiempo), y al mismo tiempo descomponer cada barra en segmentos (categorías de producto) para mostrar su contribución al total. Al agrupar estas barras por región, puedes comparar directamente el rendimiento total y la composición entre regiones.

Incorrectas:

a) Un gráfico de dispersión es útil para mostrar la relación entre dos variables numéricas, no para comparar categorías a lo largo del tiempo.

c) Un mapa de calor es bueno para mostrar la magnitud de un fenómeno en una matriz de dos dimensiones (ej. región y mes), pero no muestra fácilmente la composición de las ventas.

d) Un gráfico de barras agrupadas mostraría las ventas de cada trimestre una al lado de la otra para cada región, lo que dificulta la visualización de la tendencia total a lo largo del tiempo y no muestra la composición por categoría de producto.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Un analista de negocio está construyendo un panel de control en Cloudera Data Visualization para monitorizar las ventas trimestrales por región. Necesita un tipo de visualización que le permita comparar fácilmente el rendimiento de cada región a lo largo del tiempo y, al mismo tiempo, mostrar la contribución de cada una al total de ventas en un punto específico. ¿Qué tipo de visualización sería la más adecuada para este escenario?

A) Un gráfico de tarta (Pie Chart) para cada trimestre.
B) Un gráfico de barras apiladas (Stacked Bar Chart).
C) Un diagrama de dispersión (Scatter Plot) con el tiempo en el eje X y las ventas en el eje Y.

A

B

Explicación Correcta: Un gráfico de barras apiladas es ideal aquí. Cada barra puede representar un período de tiempo (e.g., un trimestre), y los segmentos dentro de cada barra pueden representar las diferentes regiones. La altura total de la barra muestra las ventas totales de ese trimestre, mientras que la altura de cada segmento muestra la contribución de cada región, permitiendo ambas comparaciones de forma clara y concisa.

Explicaciones Incorrectas:

A) Un gráfico de tarta es bueno para mostrar la contribución al total en un único punto en el tiempo, pero comparar varios gráficos de tarta a lo largo del tiempo es visualmente ineficiente y confuso.

C) Un diagrama de dispersión es excelente para mostrar la correlación entre dos variables numéricas, pero no es adecuado para comparar contribuciones de categorías (regiones) a un total.

D) Una tabla de datos sin procesar presenta la información precisa pero no de forma visual, lo que dificulta la identificación rápida de tendencias y comparaciones que se buscan en un dashboard.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

¿Qué funcionalidad de Cloudera Data Visualizations es esencial para permitir que los filtros aplicados en un visual (el mapa) afecten dinámicamente a otros visuales (el gráfico de barras) dentro del mismo dashboard?

A) La creación de una tabla de agregación pre-calculada en Hive para cada región.

B) El uso exclusivo de consultas SQL personalizadas para cada visual, con parámetros manuales.

C) La exportación de los datos a un archivo CSV y su posterior importación en un nuevo visual.

D) La capacidad de la herramienta para aplicar “filtros cruzados” (cross-filtering) entre visuales que comparten campos de datos comunes.

A

D

Explicación Detallada:

Opción D (Correcta): La funcionalidad principal de las herramientas de visualización interactivas como Cloudera Data Visualizations es la capacidad de vincular visuales. Al activar el “filtro cruzado” o simplemente añadiendo visuales que comparten un campo común (como ‘región’), la herramienta crea automáticamente una interacción. Al seleccionar un punto de datos en un visual, este actúa como un filtro para todos los demás visuales en el dashboard, permitiendo un análisis dinámico y exploratorio sin necesidad de reescribir consultas.

Opción A (Incorrecta): Crear tablas pre-calculadas es una técnica de optimización del backend para acelerar las consultas, pero no habilita la interactividad dinámica en el frontend del dashboard.

Opción B (Incorrecta): Usar consultas SQL personalizadas y parámetros manuales haría que el dashboard fuera estático. El usuario no podría hacer clic en el mapa para filtrar; tendría que cambiar un parámetro manualmente y volver a ejecutar la consulta, lo cual es ineficiente y poco intuitivo.

Opción C (Incorrecta): Exportar e importar datos es un proceso manual para mover datos entre sistemas, y no tiene relación con la funcionalidad de un dashboard interactivo en tiempo real.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Eres un analista de datos en una empresa de comercio electrónico y tu gerente te ha pedido crear un dashboard interactivo para monitorizar las ventas en tiempo real. Necesitas una visualización que permita a los usuarios finales filtrar las ventas por región, categoría de producto y rango de fechas de forma intuitiva.

¿Qué componente de Cloudera Data Visualizations sería el más adecuado para cumplir con este requisito de filtrado dinámico?

A) Gráfico de Torta (Pie Chart)
B) Filtros de Dashboard (Dashboard Filters)
C) Tabla de Datos (Data Table)
D) Mapa de Calor (Heat Map)

A

B

Explicación Detallada:

Opción A (Incorrecta): Un gráfico de torta es útil para mostrar la proporción de diferentes categorías dentro de un todo (por ejemplo, el porcentaje de ventas por categoría), pero no está diseñado para ser el control principal de filtrado de otros gráficos en un dashboard.

Opción B (Correcta): Los Filtros de Dashboard son la herramienta específica dentro de Cloudera Data Visualizations diseñada para este propósito. Permiten a los usuarios interactuar con el dashboard seleccionando valores de una lista, deslizando un rango o eligiendo fechas, y estos filtros se aplican a todos los gráficos y visuales relevantes del dashboard, permitiendo un análisis dinámico y personalizado.

Opción C (Incorrecta): Una tabla de datos muestra los datos en bruto en un formato tabular. Aunque puede ser útil para ver detalles, no proporciona la funcionalidad de filtrado interactivo para otras visualizaciones del dashboard.

Opción D (Incorrecta): Un mapa de calor se utiliza para visualizar la magnitud de un fenómeno en dos dimensiones, típicamente usando colores. Es una visualización de resultados, no una herramienta de control o filtrado.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Un analista de negocio necesita crear un panel de control en Cloudera Data Visualizations para monitorizar las métricas de ventas en tiempo real. El requisito principal es que los gráficos se actualicen automáticamente a medida que llegan nuevos datos a la tabla subyacente en Impala, sin que el usuario tenga que refrescar manualmente la página. ¿Qué funcionalidad de Cloudera Data Visualizations debería utilizar el analista para lograr este objetivo?

A) Habilitar la opción “Visual Caching” en la configuración del dashboard.

B) Utilizar “Smart Acceleration” para pre-cachear los resultados de las consultas.

C) Activar la opción “Live Mode” en los elementos visuales del dashboard.

D) Programar una actualización del dashboard cada minuto usando el “Scheduler”.

A

C

Explicación (Correcta): El “Live Mode” o Modo en Vivo es una característica específica de Cloudera Data Visualizations diseñada para este propósito. Cuando se activa, establece una conexión persistente con la base de datos (en este caso, Impala) y actualiza automáticamente los elementos visuales a medida que los datos cambian en la fuente, proporcionando una vista en tiempo real.

Por qué las otras son incorrectas:

A) Habilitar la opción “Visual Caching”: El caching tiene el propósito opuesto. Almacena los resultados de las consultas para acelerar la carga del dashboard en futuras visitas, pero muestra datos “antiguos” (cacheados) en lugar de datos en tiempo real.

B) Utilizar “Smart Acceleration”: Similar al caching, la aceleración inteligente (Smart Acceleration) crea y mantiene tablas agregadas o vistas materializadas para mejorar el rendimiento de las consultas, pero no proporciona actualizaciones automáticas en vivo en el frontend.

D) Programar una actualización del dashboard: Aunque programar una actualización frecuente (por ejemplo, cada minuto) puede simular un comportamiento cercano al tiempo real, no es la funcionalidad nativa para este fin. El “Live Mode” es más eficiente y está diseñado específicamente para actualizaciones instantáneas basadas en eventos de la base de datos.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Un analista de negocio está creando un dashboard en Cloudera Data Visualization para que los usuarios puedan explorar fácilmente los datos de ventas. El requisito principal es que los usuarios finales puedan filtrar interactivamente los resultados por año y por categoría de producto, sin necesidad de modificar los gráficos ni entrar en modo de edición.

¿Qué componente de Cloudera Data Visualizations es el más adecuado para cumplir con este requisito de filtrado interactivo?

A) Un visual de tipo “Tabla” con las columnas de año y categoría.
B) Un campo de “Texto” con instrucciones sobre cómo filtrar.
C) Los “Filtros de Dashboard” (Dashboard Filters) aplicados a los campos de año y categoría.
D) La configuración de “Colores” (Colors) para resaltar diferentes años y categorías.

A

C

Explicación:

Opción C (Correcta): Los “Filtros de Dashboard” son la herramienta específica diseñada para añadir interactividad a un dashboard. Permiten a los usuarios finales seleccionar valores (como un año o una categoría de producto) y aplicar esos filtros a todos los visuales relevantes del dashboard en tiempo real, sin necesidad de entrar en el modo de edición. Esto cumple exactamente con el requisito del escenario.

Opción A (Incorrecta): Un visual de tipo “Tabla” mostrará los datos, pero no proporciona una funcionalidad de filtrado interactivo para todo el dashboard. Si bien algunas tablas tienen opciones de ordenación y búsqueda interna, no actúan como un control global para otros visuales.

Opción B (Incorrecta): Un campo de texto es estático y solo puede proporcionar instrucciones. No ofrece ninguna capacidad de interacción o filtrado dinámico de los datos.

Opción D (Incorrecta): La configuración de colores se utiliza para la codificación visual de los datos (por ejemplo, asignar un color a cada región). Ayuda a la interpretación visual, pero no permite al usuario filtrar activamente la información mostrada en el dashboard.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Eres un analista de datos en una empresa de comercio electrónico y tu gerente te ha pedido crear un panel de control interactivo para visualizar las tendencias de ventas mensuales por categoría de producto. Quieres que los usuarios de negocio puedan filtrar los datos por año y región directamente en el dashboard. ¿Qué componente de Cloudera Data Visualizations es el más adecuado para añadir esta funcionalidad de filtrado interactivo?

A) Un visual de tipo Table para mostrar los datos brutos.

B) Un filtro de tipo Dropdown en el menú de configuración del dashboard.

C) Un parámetro global aplicado a nivel de la conexión de datos.

D) Un visual de tipo Filter Box directamente arrastrado al lienzo del dashboard.

A

D

Explicación Detallada:

Opción A (Incorrecta): Una tabla (Table) es un visual para mostrar datos detallados, pero no proporciona una funcionalidad de filtrado interactivo y amigable para el usuario final en el dashboard. Los usuarios podrían ordenar los datos, pero no filtrarlos de manera dinámica como se solicita.

Opción B (Incorrecta): Aunque se pueden aplicar filtros al crear o editar un visual, la opción de “Dropdown” en el menú de configuración no es la forma estándar de añadir controles de filtrado interactivos para los usuarios finales directamente en el lienzo del dashboard.

Opción C (Incorrecta): Los parámetros a nivel de conexión de datos son útiles para filtrar datos en la fuente (por ejemplo, en la consulta SQL subyacente), pero no ofrecen un control interactivo en la interfaz del dashboard para que un usuario de negocio pueda cambiar los valores dinámicamente.

Opción D (Correcta): El visual de tipo Filter Box está diseñado específicamente para este propósito. Se añade al lienzo del dashboard como cualquier otro gráfico y se configura para controlar una o más columnas (en este caso, ‘año’ y ‘región’). Esto permite a los usuarios finales hacer clic y seleccionar las opciones que deseen, y todos los demás visuales del dashboard se actualizarán automáticamente para reflejar la selección. Es la herramienta principal para crear interactividad dirigida por el usuario.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

You are building a dashboard to monitor sales performance across different regions. You want the dashboard to automatically refresh every hour and allow users to filter by “Product Category.”
Which configuration ensures this requirement?

A. Schedule auto-refresh to 1 hour and add a filter widget bound to “Product Category”

B. Embed the dashboard in Hive for dynamic query execution

C. Enable “Static Filters” and set refresh to manual only

D. Create a materialized view in Impala and disable dashboard filters

A

A

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

A stakeholder complains that a bar chart showing quarterly revenue is misleading because the Y-axis does not start at zero.
Which visualization best practice should you apply?

A. Always truncate axes to maximize detail
B. Force Y-axis to start at zero for bar charts
C. Use 3D charts for better clarity
D. Replace bar chart with a pie chart

A

B

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Un analista de datos quiere visualizar la evolución del número de visitantes de una página web, registrando los datos cada hora durante un día completo para indentificar patrones y picos de tráfico. ¿Qué método de análisis o tipo de visualización representa mejor este enfoque?

a) Gráfico de Barras Comparativo
b) Diagrama de Dispersión
c) Análisis de Series Temporales
d) Análisis de Frecuencia

A

C

La pregunta se centra en el “método” y el “enfoque” de analizar datos a los largo del tiempo, que es la definición exacta de una serie temporal

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Se ha finalizado un dashboard de rendimiento de ventas en CDV y se necesita compartirlo con otros usuarios de la organización para que puedan interactuar con los datos.

Pregunta: ¿Cuál es el método estándar para compartir un dashboard completado con otros en Cloudera Data Visualization?

A) Exportándolo como un archivo PDF.

B) Compartiéndolo a través de un servicio de almacenamiento en la nube.

C) Enviando los archivos de datos brutos por correo electrónico.

D) Proporcionando un enlace URL directo.

A

D

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Un analista de negocio necesita crear un cuadro de mando en Cloudera Data Visualizations para el equipo de dirección. El objetivo es que los directivos puedan, de un solo vistazo, comprender el rendimiento de las ventas del último trimestre, comparando los ingresos por región y las categorías de productos más vendidas. ¿Cuál es el principio fundamental que el analista debe seguir al construir este dashboard?

A) Incluir tantos gráficos y tablas como sea posible para proporcionar todos los datos disponibles.

B) Utilizar colores muy llamativos y animaciones complejas para captar la atención del usuario.

C) Priorizar la consolidación visual de Indicadores Clave de Rendimiento (KPIs) para una interpretación rápida y sencilla.

D) Diseñar el dashboard principalmente para la exportación a formato PDF, asegurando que se imprima correctamente.

A

C

Explicación Detallada:

Opción C (Correcta): El propósito principal de un dashboard es comunicar información crítica de manera eficiente. Esto se logra identificando y visualizando los KPIs más importantes (en este caso, ingresos por región y por categoría). La clave es la claridad y la capacidad de obtener conclusiones rápidas, lo cual se consigue consolidando la información más relevante.

Opción A (Incorrecta): Sobrecargar un dashboard con demasiada información (conocido como “ruido”) va en contra de su propósito. Causa confusión y dificulta la identificación de los datos importantes. Un buen dashboard es selectivo y enfocado.

Opción B (Incorrecta): Aunque la estética es importante, el uso excesivo de colores llamativos o animaciones puede distraer y dificultar la lectura de los datos. La funcionalidad y la claridad siempre deben prevalecer sobre la decoración.

Opción D (Incorrecta): Los dashboards modernos son herramientas interactivas diseñadas para la exploración (filtrado, desglose). Aunque pueden ser exportables, su diseño principal debe centrarse en la interactividad en pantalla, no en un formato estático como el PDF.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Eres un analista de datos y has creado un nuevo Dashboard en Cloudera Data Visualizations para monitorizar las ventas trimestrales. Quieres asegurarte de que los datos mostrados se actualicen automáticamente cada hora sin necesidad de que los usuarios recarguen manualmente toda la página del navegador.

¿Qué configuración debes habilitar en tu Dashboard para lograr este comportamiento?

A) Habilitar la opción “Auto-refresh” en la configuración del navegador web.

B) Configurar un “Schedule” para el Dashboard desde la interfaz de administración de Cloudera.

C) Activar la función “Live Mode” en la configuración del Dashboard.

D) Escribir un script personalizado usando la API de Visuals para forzar la recarga de datos.

A

C

Explicación Detallada:

Opción C (Correcta): La función “Live Mode” (Modo en Vivo) en Cloudera Data Visualizations está diseñada específicamente para este propósito. Cuando se activa, el dashboard se conecta directamente a la fuente de datos y actualiza los visuals a intervalos regulares y cortos de forma automática, reflejando los datos más recientes sin intervención del usuario.

Opción A (Incorrecta): Recargar toda la página del navegador es ineficiente y no es una funcionalidad propia de la herramienta. Forzaría la recarga de todos los elementos, no solo de los datos, y depende del navegador, no del dashboard.

Opción B (Incorrecta): La programación (“Scheduling”) de dashboards se utiliza generalmente para generar y distribuir informes estáticos (por ejemplo, enviar un PDF por correo electrónico) en un horario fijo, no para actualizar una vista en vivo de forma interactiva.

Opción D (Incorrecta): Si bien la API podría ofrecer alguna capacidad de personalización, escribir un script es una solución demasiado compleja y propensa a errores para una funcionalidad estándar que ya viene incorporada en la herramienta a través del “Live Mode”.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Un analista de negocio necesita crear un informe interactivo para la dirección que muestre las ventas trimestrales por región y categoría de producto. El requisito principal es que los directores puedan filtrar los datos por año y región de forma dinámica y explorar los detalles de una categoría específica haciendo clic en un gráfico de barras para que un gráfico de tarta adjunto se actualice automáticamente. ¿Qué funcionalidad de Cloudera Data Visualization es la más adecuada para lograr esta interactividad entre gráficos?

a) Usar la función “Schedule” para refrescar el dashboard cada minuto.

b) Añadir filtros globales a nivel de dashboard para el año y la región.

c) Activar la opción “Click-through” en el gráfico de barras de origen para que actúe como filtro sobre el gráfico de tarta de destino.

d) Exportar los datos a un CSV y usar una herramienta externa para crear los gráficos interactivos.

A

C

Explicación (Correcta): La funcionalidad “Click-through” (o a veces llamada “cross-filtering” o “drill-through” dependiendo del contexto específico de la herramienta) está diseñada precisamente para este propósito. Permite que una selección en un visual (el gráfico de barras de categorías) actúe como un filtro dinámico para otro visual (el gráfico de tarta) dentro del mismo dashboard. Esto crea una experiencia de análisis guiada e interactiva, cumpliendo exactamente el requisito.

Explicación (Incorrectas):

a) Usar la función “Schedule” para refrescar el dashboard cada minuto: La programación de actualizaciones se usa para mantener los datos del dashboard frescos desde la fuente, pero no tiene nada que ver con la interactividad entre los componentes visuales del propio dashboard.

b) Añadir filtros globales a nivel de dashboard para el año y la región: Si bien esto cumple con el primer requisito de filtrado dinámico por año y región para todo el dashboard, no aborda la necesidad específica de que un gráfico filtre a otro al hacer clic en él. Es una parte de la solución, pero no la funcionalidad clave solicitada.

d) Exportar los datos a un CSV y usar una herramienta externa: Esto es una solución ineficiente que va en contra del propósito de usar una herramienta integrada como Cloudera Data Visualization. El objetivo es construir la interactividad dentro de la propia plataforma.

17
Q

Un analista está construyendo un dashboard en Cloudera Data Visualization y necesita mostrar el “Total de Ventas” del año actual en un visual de tipo “KPI” (Key Performance Indicator). La tabla subyacente ventas_historicas contiene datos de varios años. ¿Cuál es la forma más eficiente y robusta de crear la medida (measure) para este KPI dentro de la herramienta de visualización?

a) Aplicar un filtro a nivel del visual para que año = 2025.

b) Crear una nueva columna calculada en el conjunto de datos con la expresión IF(año = 2025, ventas, 0).

c) Usar una consulta SQL personalizada al crear el conjunto de datos: SELECT SUM(ventas) FROM ventas_historicas WHERE año = 2025.

d) Crear una medida agregada con una expresión de filtro, algo similar a SUM(IF(año = YEAR(NOW()), ventas, NULL)), para que se actualice dinámicamente cada año.

A

D

Explicación (Correcta): Esta es la solución más robusta y de bajo mantenimiento. Al crear una medida (measure) con una lógica dinámica (YEAR(NOW())), el cálculo siempre se referirá al año actual sin necesidad de intervención manual. El KPI mostrará ‘Ventas 2025’ durante el año 2025, y automáticamente mostrará ‘Ventas 2026’ cuando comience el nuevo año. El uso de NULL en el ELSE asegura que las filas de otros años sean ignoradas por la función de agregación SUM.

Explicación (Incorrectas):

a) Aplicar un filtro a nivel del visual: Esto funciona, pero es una solución “hard-coded”. El 1 de enero de 2026, el analista tendría que editar manualmente el dashboard y cambiar el filtro a 2026.

b) Crear una nueva columna calculada: Esto materializaría una nueva columna en el modelo de datos, lo que puede ser ineficiente en términos de memoria y procesamiento, especialmente en conjuntos de datos grandes. Además, la lógica sigue siendo estática (año = 2025) y requeriría una actualización manual.

c) Usar una consulta SQL personalizada: Esto limita el conjunto de datos solo a las ventas del año 2025. Si otro visual en el mismo dashboard necesitara mostrar una comparación con el año anterior, sería imposible con este conjunto de datos. El objetivo es tener un modelo de datos flexible que permita múltiples análisis.

18
Q

Dentro de una herramienta de visualización de datos, se necesita crear un gráfico para mostrar el flujo continuo de visitantes únicos por hora, conectando los puntos de datos para revelar la tendencia a lo largo de un día. ¿Qué widget o tipo de gráfico específico sería el más adecuado seleccionar para esta tarea?

a) Gráfico de Líneas
b) Gráfico Circular
c) Tabla de Datos
d) Histograma

A

A

La pregunta se centra en el “widget” o “gráfico específico” que se debe seleccionar en el software para ejecutar la tarea, lo que se corresponde al gráfico de líneas.

19
Q

Un analista de negocio necesita presentar el rendimiento trimestral de ventas de cinco productos diferentes a lo largo de los últimos tres años. El objetivo principal es comparar el volumen de ventas de cada producto en un mismo trimestre y, a la vez, mostrar la tendencia de cada producto a lo largo del tiempo. ¿Qué tipo de visualización en Cloudera Data Visualization sería la más efectiva para este propósito?

A) Un gráfico de tarta (Pie Chart) para cada año, mostrando la proporción de ventas por producto.

B) Un gráfico de barras apiladas (Stacked Bar Chart), donde cada barra representa un año y los segmentos de color representan los productos.

C) Un gráfico de líneas (Line Chart) con una línea de color diferente para cada producto, donde el eje X representa el tiempo (trimestres) y el eje Y representa el volumen de ventas.

D) Una tabla de datos (Data Table) con los valores de ventas exactos por producto y trimestre.

A

C

Explicación:

Opción C (Correcta): Un gráfico de líneas es ideal para mostrar tendencias de datos continuos a lo largo del tiempo. Asignar una línea a cada producto permite una comparación directa y clara de su rendimiento a través de los trimestres y años. Se puede identificar fácilmente qué productos están creciendo, cuáles están disminuyendo y cómo se comparan entre sí en cualquier punto del tiempo.

Opción A (Incorrecta): Un gráfico de tarta es útil para mostrar la composición de un todo en un único punto en el tiempo (por ejemplo, la cuota de mercado en un solo año). Sin embargo, es muy ineficaz para mostrar tendencias a lo largo de múltiples períodos y comparar productos de manera evolutiva.

Opción B (Incorrecta): Un gráfico de barras apiladas mostraría el total de ventas por año y la contribución de cada producto, pero haría muy difícil seguir la tendencia individual de un producto específico, especialmente si no es el que está en la base de la barra.

Opción D (Incorrecta): Aunque una tabla de datos proporciona los valores exactos, no es una “visualización” en el sentido estricto. No permite identificar patrones, tendencias o comparaciones de un vistazo, que es el objetivo principal de la solicitud.

20
Q

Un analista de negocio necesita presentar el rendimiento de ventas trimestral de cinco líneas de productos diferentes durante los últimos tres años. El objetivo es comparar rápidamente el volumen de ventas de cada línea de producto en un trimestre específico y, al mismo tiempo, observar la tendencia de cada línea de producto a lo largo del tiempo. ¿Qué tipo de visualización sería la más efectiva para este propósito en Cloudera Data Visualizations?

A) Un gráfico de tarta (Pie Chart) para cada año, mostrando la contribución de cada línea de producto.

B) Un gráfico de barras apiladas (Stacked Bar Chart), con el tiempo en el eje X y las ventas en el eje Y, donde cada barra representa un trimestre.

C) Un diagrama de dispersión (Scatter Plot) con las ventas en el eje Y y el tiempo en el eje X.

D) Una tabla de datos sin procesar con columnas para fecha, línea de producto y ventas.

21
Q

Un analista de negocio necesita presentar un informe que muestre el volumen total de ventas mensuales (en millones de euros) y la variación porcentual del crecimiento de ventas mes a mes para el último año en una única visualización. El objetivo es comparar fácilmente los picos de ventas con los momentos de mayor crecimiento. ¿Qué tipo de gráfico en Cloudera Data Visualizations sería el más adecuado para esta tarea?

A) Un gráfico de barras apiladas para mostrar el total y el crecimiento en la misma barra.

B) Un gráfico de dispersión (Scatter Plot) con el mes en el eje X y las ventas en el eje Y.

C) Un gráfico circular (Pie Chart) para cada mes, mostrando el porcentaje de ventas.

D) Un gráfico combinado (Combination Chart) con barras para el volumen de ventas y una línea para la variación porcentual.

A

D

Explicación Detallada:

Opción D (Correcta): Un gráfico combinado es la solución ideal aquí. Permite utilizar un eje Y primario para una métrica (volumen de ventas, representado por barras para una fácil comparación de magnitud) y un eje Y secundario para una métrica con una escala diferente (variación porcentual, representada por una línea para mostrar la tendencia claramente). Esto cumple exactamente con el requisito de visualizar y comparar ambas métricas de forma simultánea y efectiva.

Opción A (Incorrecta): Las barras apiladas se usan para mostrar cómo las partes de una categoría contribuyen al total. Intentar apilar el volumen de ventas y un porcentaje de crecimiento no tiene sentido lógico ni visual.

Opción B (Incorrecta): Un gráfico de dispersión es excelente para mostrar la correlación entre dos variables numéricas, pero no es la mejor opción para visualizar una serie temporal como las ventas mensuales de una manera que sea fácil de interpretar para un informe de negocio.

Opción C (Incorrecta): Los gráficos circulares son adecuados para mostrar la composición de un todo en un único punto en el tiempo. Usarlos para una serie temporal es ineficaz y haría la comparación entre meses muy difícil.

22
Q

Un analista ha creado un informe de ventas en Cloudera Data Visualizations. Ha incluido un gráfico de barras que muestra las ventas por región. Ahora desea añadir un filtro interactivo en el panel de control para que los usuarios puedan seleccionar la región que desean ver. ¿Qué componente debería arrastrar al panel de control para lograr este objetivo?

A. Un campo de texto.
B. Un gráfico de línea.
C. Un widget de filtro.
D. Una tabla de datos.

A

C

En Cloudera Data Visualizations, los widgets de filtro están diseñados específicamente para agregar interactividad a los paneles de control. Al arrastrar un widget de filtro y asociarlo a un campo de datos (región en este caso), los usuarios pueden seleccionar dinámicamente el valor de la región, y el gráfico de barras se actualizará automáticamente para mostrar solo los datos de la región seleccionada.

Por qué las otras opciones son incorrectas:

A. Un campo de texto: Un campo de texto es para mostrar texto estático, no para filtrar datos.

B. Un gráfico de línea: Un gráfico de línea es una visualización para mostrar tendencias, no una herramienta para filtrar otros gráficos.

D. Una tabla de datos: Una tabla de datos muestra datos en formato tabular, pero no tiene la funcionalidad de un filtro interactivo para el resto del panel de control.

23
Q

Un analista de negocio desea presentar el desglose de las ventas del último trimestre por categoría de producto. El objetivo es mostrar qué proporción del total de ventas representa cada categoría. ¿Qué tipo de visualización en Cloudera Data Visualizations (CDV) sería la más adecuada para comunicar esta información de manera clara e inmediata?

A) Gráfico de líneas (Line Chart)
B) Gráfico de dispersión (Scatter Plot)
C) Gráfico circular o de tarta (Pie Chart)
D) Tabla de datos (Data Table)

24
Q

Eres un analista de datos en una empresa de e-commerce y tu gerente te ha pedido que crees un dashboard para monitorizar las ventas a lo largo del tiempo y comparar el rendimiento de diferentes categorías de productos. Necesitas un tipo de gráfico que muestre claramente la tendencia de ventas mensuales para cada categoría durante el último año.

¿Qué tipo de visualización en Cloudera Data Visualizations sería la más apropiada para esta tarea?

A) Un gráfico de dispersión (Scatter Plot) para correlacionar el precio del producto con el número de unidades vendidas.

B) Un gráfico de tarta (Pie Chart) para mostrar la proporción de ventas totales por categoría en el último mes.

C) Un gráfico de líneas múltiples (Multiple Line Chart), donde cada línea representa una categoría de producto y el eje X representa los meses.

D) Una tabla de datos (Data Table) que liste cada transacción de venta individual.

25
Un analista de negocio quiere comparar visualmente la distribución de la edad de los clientes entre dos regiones distintas (Norte y Sur). Necesita ver la forma de la distribución, el valor promedio y la dispersión de los datos para cada región en una sola visualización. ¿Qué tipo de visualización de Cloudera Data Visualization es la más adecuada para cumplir con estos requisitos de comparación de distribución? A. Un Gráfico de Barras Agrupadas (Grouped Bar Chart) B. Un Mapa de Calor (Heatmap) C. Un Gráfico de Dispersión (Scatter Plot) D. Un Diagrama de Caja y Bigotes (Box and Whisker Plot)
D. Un Diagrama de Caja y Bigotes (Box and Whisker Plot) Opción D (Correcta): Un Diagrama de Caja y Bigotes (Box Plot) es la visualización por excelencia para comparar la distribución de una variable numérica (Edad) a través de distintas categorías (Regiones). Muestra cinco números clave: el valor mínimo, el primer cuartil (Q_1), la mediana (Q_2), el tercer cuartil (Q_3) y el valor máximo, lo que revela la forma de la distribución, la tendencia central (mediana) y la dispersión (rango intercuartílico). Opción A (Incorrecta): Un Gráfico de Barras Agrupadas se usa para comparar el recuento o la suma de una métrica categórica (por ejemplo, el recuento total de clientes por región), no la distribución de una variable numérica como la edad. Opción B (Incorrecta): Un Mapa de Calor se utiliza para visualizar la densidad de datos o la magnitud de una variable en una matriz de dos dimensiones, no para la comparación directa de distribuciones univariantes. Opción C (Incorrecta): Un Gráfico de Dispersión se utiliza para examinar la relación entre dos variables numéricas (por ejemplo, Edad vs. Ingreso), no la distribución de una sola variable categórica.
26
Un analista de negocio desea crear un informe interactivo para el equipo de marketing. El objetivo es visualizar la distribución de las ventas por categoría de producto y región geográfica, permitiendo al equipo filtrar los datos por año y trimestre con un solo clic. ¿Qué tipo de componente debería utilizar principalmente en su dashboard de Cloudera Data Visualization para lograr esta interactividad? A) Un Gráfico de Dispersión (Scatter Plot) para mostrar la correlación entre ventas y región. B) Un Visual de Texto Estático (Static Text Visual) para describir los filtros aplicables. C) Un Selector de Filtros (Filter Selector) vinculado a las columnas de año y trimestre en el conjunto de datos. D) Una Tabla de Datos (Data Table) con todas las ventas sin procesar para máxima granularidad.
C
27
En un dashboard de Cloudera Data Visualizations (CDV) aparece una métrica de conversion rate calculada como SUM(conversions) / SUM(sessions) agregada por semana. Al filtrar por país, algunos países muestran tasas superiores al 100%. ¿Cuál es la explicación más probable? A. Hay un error en la agregación: la métrica debería calcularse a nivel de fila y luego promediarse por semana. B. El dashboard está aplicando un filtro que duplica sessions pero no conversions. C. Las conversiones fueron registradas en una escala distinta (por ejemplo, porcentaje en lugar de conteo). D. Es imposible que la tasa supere 100%; por tanto, el origen de datos está corrupto.
A