Datos, Ejercicios y Presentación Curso PowerBI Dextro
¡Bienvenidos! En este repositorio podéis encontrar un .doc con el contenido formativo del curso. También disponéis de la presentación que se usará para comenzar el curso.
Los dos días de formación se dividirán en lo siguiente:
-
Veremos una breve introducción a PowerBI, consejos para trabajar con datos y algunos ejemplos de informes.
-
Daremos un pequeño vistazo a PowerBI Desktop.
-
Haremos un ejercicio para aprender cómo cargar y preparar datos en un report. Podéis encontrar los datos en un .csv en la carpeta Ejercicio 1 de este repositorio.
-
Exploraremos PowerBI Desktop de forma más extensa.
-
Haréis de manera autónoma un ejercicio para preparar una dashboard. Podéis encontrar 3 tablas en el archivo .xlsx en la carpeta Ejercicio 2 de este repositorio. A continuación tenéis algunos consejos para el ejercicio.
La aplicación de escritorio se puede descargar de manera gratuita en la página oficial de PowerBI. Recomendable instalarlo en español (los nombres de los elementos y objetos cambian). El curso está preparado en español.
PowerBI carga los datos desde la fuente (local o remota) y convierte en un dataset que se guarda en el modelo.
Para mostrar cambios en los datos originales, requiere actualizar los datos desde el modelo de PowerBI (Tabla -> Actualizar datos). También se puede especificar un calendario de actualizaciones periodicas.
Importante: Cuando se actualiza los datos, se está creando 2 copias del mismo dataset (mucho consumo!). PowerBI mantiene la copia antigua para queries y distintas acciones que trabajan con el dataset. Esta copia no se elimina hasta que no se termina la actualización.
DirectQuery mode: Realiza peticiones a la fuente de datos cada vez que se trabaja o accede al informe o tiles asociados.
LiveConection: Carga un dataset ya preparado y almacenado, ya sea un dataset en PowerBI Service, Azure Analysis Services (AAS) database o on-premises instance of SQL Server Analysis Services (SSAS). Push:
Otra opción es requerir que el modelo PowerBI acepte un dataset mediante un push en vez de realizar una petición desde el modelo. Cada vez que se realiza un nuevo push, el dataset del modeo se actualiza. Útil para informes con información en tiempo real. Ejemplo de aplicaciones: Azure Stream Analytics.
Más información en: la ayuda oficial de PowerBI sobre conexiones a datos y en Live connection and DirectQuery comparison.
Storage mode | Data refresh | OneDrive refresh | Query caches | Tile refresh | Report visuals |
---|---|---|---|---|---|
Import | Scheduled and on-demand | Yes, for connected datasets | If enabled on Premium capacity | Automatically and on-demand | No |
DirectQuery | Not applicable | Yes, for connected datasets | If enabled on Premium capacity | Automatically and on-demand | No |
LiveConnect | Not applicable | Yes, for connected datasets | If enabled on Premium capacity | Automatically and on-demand | Yes |
Push | Not applicable | Not applicable | Not practical | Automatically and on-demand | No |
Podéis encontrar el archivo .csv "HPI_editado" que usaremos en la carpeta Ejercicio 1
.
Esta tabla muestra una serie de índices calculados para el precio de viviendas a nivel nacional y estatal en USA desde 1975 hasta 2022.
Haremos los siguientes pasos el día 1. Pero en caso de que necesitéis revisarlos más adelante, aquí están por orden:
- Obtener datos -> Texto o csv. Seleccionar 'HPI_editado'.
- Transformar datos.
- Esta tabla tiene formato internacional. Los decimales están separados por punto. Eliminamos tipo cambiado (panel a la derecha).
- Filtramos
level
por "Estados" yhpi_type
por "Tradicional". ¡Hay que seleccionar "Cargar más" antes de hacer el filtrado! - Comprobamos si hay valores faltantes (NA, NULL o blanco en cada filtro de columna).
- Movemos la columna
quarter_1
(arrastramos) para situarla antes quequarter_2
. - Anulamos dinamización de las columnas
quarter_1
,quarter_2
,quarter_3
yquarter_4
. - Cambiamos nombres de las columnas
Atributo
por "Quarter",Valor
por "Index". - En la columna
Quarter
reemplazamos valores "quarter_" por "" (en blanco). Así nos quedamos solo con el número. - Hay un NA escondido. En columna
Index
remplazamos valor "NA" por "" (en blanco). - Cambiar columna
Index
de texto a decimal. Cambiar tipo -> Usar configuración regional -> Seleccionar "Inglés (Estados Unidos)".
- Reemplazar
place_id
para "Indiana".
= Table.ReplaceValue(#"Valor reemplazado",each [place_id],each if [place_name] = "Illinois" then "IL" else [place_id],Replacer.ReplaceText,{"place_id"})
- En
HPI_flavor
filtrar por "purchase-only".
- Creamos columna "Year - Q" seleccionando ambas columnas, y en la pestaña "Agregar columna" buscamos "Combinar columna". En "separador" podemos elegir Personalizada y escribir " - ". En nombre escribimos "Year - Q".
Podéis encontrar el ejemplo del ejercicio 2 en este Data Story template de PowerBI. Los imágenes no coincidirán, porque los datos no son iguales.
- Clientes: está formada por Nombre de los usuario, Jerarquía, País donde trabajan, Género
- Tickets_apertura: ID de los tickets, fecha de apertura, OwnerName = Trabajador encargado, RequestorName = usuario/cliente, País del cliente, Tipo de petición, Categoría de la ayuda, Status = Cerrado o abierto, Prioridad
- Tickets_cierre: ID de los tickets, Fecha de Cierre, OwnerName = Trabajador encargado, Status (Cerrado), Satisfacción del cliente, Nº días para cerrar.
-
En la carpeta
Ejercicio 2
tenéis un archivo .pbix (powerBI) con la plantilla para el reporte preparada y un excel (.xslx) con las tablas. -
¡Recordar revisar las tablas! Hay que especificar que cada columna sea del tipo de variable correcto.
-
¡Cuidado con la variable género!. Está codificada. 0: Male, 1: Female
-
Para mostrar los días que han pasado desde que se abrió un ticket (
Days Open
) podeís crear una nueva columna con el siguiente código: " Date.From(DateTime.LocalNow()) - [OpenDate]" (Columna OpenDate->Insertar). Lo veremos juntos! -
Para crear el gráfico de área con tickets cerrados y abiertos hay que crear dos medidas rápidas.
a. Closed: Medida rápida -> Cálculo -> Valor filtrado: Valor base =
TicketsID
(Recuento), Filtro =Status
(Closed)b. Open: Medida rápida -> Cálculo -> Valor filtrado: Valor base =
TicketsID
(Recuento), Filtro =Status
(Open y Closed)
Lo veremos juntos!
- Microsoft borró el objeto visual de histograma a finales de 2022 y no se puede usar. No haremos ese visual.