Power BI – Gjøre en «page scrape»

Power BI kan hente data fra mange forskjellige kilder. En kanskje litt undervurdert mulighet er å gjøre en såkalt page-scrape. Det er litt grisete, men det funker! Her er ett eksempel.

Jeg ser at det er mange som har laget skikkelig kule og gode Power BI rapporter på spredningen av Corona-viruset. Etter å ha lest litt om hvordan mange har gjort det, fant jeg ut at dette var mye arbeid og mange kilder. Kunne jeg gjøre det på en enklere måte?

Jeg har tatt utgangspunkt i nettsiden www.worldometers.info/coronavirus/ for her fant jeg en tabell som det var enkelt å fange opp.

Jeg går på «Get Data» i Power BI, velger «From web» og legger inn URL’en:

Get data from web

Denne siden har to tabeller, en for gårsdagens tall og en for dagens tall, så da var det bare å finne ut hvilken av disse tabellene jeg ville ha:

Power BI Navigator

Nå måtte jeg rense opp datagrunnlaget litt for å kunne bruke det til noe praktisk. Power BI strever like mye som andre Microsoft-produkter med regionale regler ved bruk av komma og punktum. Så jeg konverterte radene til tekst, fjernet komma og konvertere tilbake til heltall. Det finnes sikkert en lettere måte å gjøre dette på, men det funker.

Jeg måtte også fjerne + tegnet i noen rader:

Power Query Editor

Sånn, da hadde jeg fått ett godt datasett og kunne begynne å leke meg med visualiseringer og lage noen gode dashboards:

Ferdig Power BI rapport

Konklusjon

OK, dette er ett ganske «enkelt» eksempel fordi websiden jeg hentet data fra hadde en tabell som Power BI fanget opp, ikke alle websider har det lenger og da krever det en god del mer innsats, det finnes andre guider rundt omkring som forklarer dette i detalj, mulighetene er der ihvertfall 🙂

Hvis du ønsker å laste ned .PBIX filen min så gjør gjerne det.

Jeg avslutter med en liten video med dr. Seema Yasmin som svarer på de 50 meste stilte spørsmålene om Corona-viruset på nettet:

Legg igjen en kommentar