Hinweis
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, sich anzumelden oder das Verzeichnis zu wechseln.
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, das Verzeichnis zu wechseln.
Der Algorithmus zur Abtastung in Power BI verbessert visuelle Elemente, die hochdichte Daten verarbeiten. Sie können z. B. ein Liniendiagramm aus den Verkaufsergebnissen Ihrer Einzelhandelsgeschäfte erstellen, wobei jedes Geschäft mehr als 10.000 Verkaufsbestätigungen pro Jahr enthält. Ein Liniendiagramm mit solchen Verkaufsinformationsmuster-Daten aus den Daten für jedes Geschäft erstellt ein multiserielles Liniendiagramm, das die zugrunde liegenden Daten darstellt. Wählen Sie eine aussagekräftige Darstellung dieser Daten aus, um zu veranschaulichen, wie der Umsatz im Laufe der Zeit variiert. Diese Vorgehensweise ist bei der Visualisierung von Daten mit hoher Dichte üblich. Die Details der Stichproben mit hoher Dichte werden in diesem Artikel beschrieben.
Hinweis
Der in diesem Artikel beschriebene Samplingalgorithmus mit hoher Dichte ist sowohl in Power BI Desktop als auch im Power BI-Dienst verfügbar.
Wie die Linienabtastung mit hoher Dichte funktioniert
Zuvor wählte Power BI eine Sammlung von Beispieldatenpunkten im vollständigen Bereich der zugrunde liegenden Daten in einer deterministischen Weise aus. Mit Daten mit hoher Dichte in einem visuellen Zeitraum von einem Kalenderjahr zeigt das Visuelle beispielsweise 350 Beispieldatenpunkte an. Der Algorithmus wählt jeden Datenpunkt aus, um sicherzustellen, dass der gesamte Datenbereich im visuellen Bereich dargestellt wird. Um zu verstehen, wie dies geschieht, stellen Sie sich vor, einen Aktienkurs über einen Zeitraum von einem Jahr zu zeichnen und 365 Datenpunkte auszuwählen, um ein Liniendiagramm visuell zu erstellen. Das ist ein Datenpunkt für jeden Tag.
In dieser Situation gibt es innerhalb eines Tages viele Werte für einen Aktienkurs. Natürlich gibt es ein Tageshoch und ein Niedriges, aber diese Werte können jederzeit während des Tages auftreten, wenn die Börse geöffnet ist. Wenn die zugrunde liegende Datenprobe täglich um 10:30 Uhr und 12:00 Uhr aufgenommen wird, erhalten Sie für die Stichprobe mit hoher Dichte eine repräsentative Momentaufnahme der zugrunde liegenden Daten, z. B. den Preis um 10:30 Uhr und 12:00 Uhr. Die Momentaufnahme erfasst jedoch möglicherweise nicht das tatsächliche Hoch und das Tief des Aktienkurses für diesen repräsentativen Datenpunkt an diesem Tag. In dieser Situation und anderen ist das Sampling repräsentativ für die zugrunde liegenden Daten, aber es erfasst nicht immer wichtige Punkte, die in diesem Fall tageskurshochs und Tiefstwerte sein würden.
Per Definition werden Daten mit hoher Dichte analysiert, um Visualisierungen relativ schnell zu erstellen, die auf Interaktivität reagieren. Zu viele Datenpunkte eines visuellen Elements können es verlangsamen und die Sichtbarkeit von Trends beeinträchtigen. Wie die Daten analysiert werden, steuert die Erstellung des Samplingalgorithmus, um die beste Visualisierung zu ermöglichen. In Power BI Desktop bietet der Algorithmus die beste Kombination aus Reaktionsfähigkeit, Darstellung und klarer Erhaltung wichtiger Punkte in jeder Zeitscheibe.
Funktionsweise des Liniensamplingalgorithmus
Der Algorithmus für hochdichtes Linien-Sampling ist für Liniendiagramme und Flächendiagramme mit einer kontinuierlichen x-Achse verfügbar.
Bei einer visuellen Grafik mit hoher Dichte segmentiert Power BI Ihre Daten intelligent in hochauflösende Blöcke und wählt dann wichtige Punkte aus, um jeden Block darzustellen. Dieser Prozess des Schneidens von hochauflösenden Daten wird optimiert, um sicherzustellen, dass das resultierende Diagramm visuell nicht von dem Rendern aller zugrunde liegenden Datenpunkte unterscheidbar ist, jedoch schneller und interaktiver gestaltet ist.
Mindest- und Höchstwerte für visuelle Linien mit hoher Dichte
Für jede Visualisierung gelten die folgenden Einschränkungen:
- 3.500 ist die maximale Anzahl von Datenpunkten, die für die meisten visuellen Elemente angezeigt werden , unabhängig von der Anzahl der zugrunde liegenden Datenpunkte oder Datenreihen. Ausnahmen finden Sie in der folgenden Liste. Wenn Sie beispielsweise über 10 Datenreihen mit jeweils 350 Datenpunkten verfügen, erreicht das Visuelle seine maximale Gesamtmenge der Datenpunkte. Wenn Sie eine Serie haben, kann sie bis zu 3.500 Datenpunkte umfassen, wenn der Algorithmus dies als die beste Stichprobe für die zugrunde liegenden Daten erachtet.
- Es gibt maximal 60 Datenreihen für alle visuellen Elemente. Wenn Sie mehr als 60 Datenreihen haben, trennen Sie die Daten, und erstellen Sie mehrere visuelle Elemente mit jeweils 60 oder weniger Datenreihen. Es empfiehlt sich, einen Datenschnitt zu verwenden, um nur Segmente der Daten anzuzeigen, aber nur für bestimmte Datenreihen. Wenn Sie beispielsweise alle Unterkategorien in der Legende anzeigen, können Sie einen Datenschnitt verwenden, um nach der Gesamtkategorie auf derselben Berichtsseite zu filtern.
Die maximale Anzahl von Datenlimits ist für die folgenden visuellen Typen höher, bei denen es sich um Ausnahmen vom Grenzwert von 3.500 Datenpunkten handelt:
- Maximal 150.000 Datenpunkte für R-Visualisierungen.
- 30.000 Datenpunkte für visuelle Azure Map-Elemente.
- 10.000 Datenpunkte für einige Punktdiagrammkonfigurationen (Punktdiagramme sind standardmäßig 3.500).
- 3.500 für alle anderen Visualisierungen mit hoher Dichte Sampling. Einige andere visuelle Elemente visualisieren möglicherweise mehr Daten, verwenden jedoch kein Sampling.
Diese Parameter stellen sicher, dass visuelle Elemente in Power BI Desktop schnell gerendert werden, auf Benutzerinteraktionen reagieren und keinen unnötigen Rechenaufwand auf dem Computer verursachen, der das visuelle Rendering ausführt.
Auswerten repräsentativer Datenpunkte für visuelle Linien mit hoher Dichte
Wenn die Anzahl der zugrunde liegenden Datenpunkte die maximalen Datenpunkte überschreitet, die das visuelle Element darstellen kann, beginnt ein Prozess, der als Binning bezeichnet wird. Durch das Binning werden die zugrunde liegenden Daten in Gruppen zusammengefasst, die als Bins bezeichnet werden, und diese Bins werden dann iterativ verfeinert.
Der Algorithmus erstellt so viele Container wie möglich, um die größtmögliche Granularität für das Visuelle zu schaffen. Innerhalb jedes Bins findet der Algorithmus den minimalen und maximalen Datenwert, um sicherzustellen, dass wichtige und signifikante Werte, z. B. Ausreißer, erfasst und im Visuellen angezeigt werden. Basierend auf den Ergebnissen des Binnings und der nachfolgenden Auswertung der Daten durch Power BI wird die Mindestauflösung für die x-Achse für die visuelle Darstellung bestimmt, um die maximale Granularität für die visuale Darstellung sicherzustellen.
Wie bereits erwähnt, beträgt die minimale Granularität für jede Datenreihe 350 Punkt, und das Maximum beträgt 3.500 für die meisten visuellen Elemente. Die Ausnahmen werden im vorherigen Abschnitt aufgeführt.
Jeder Behälter wird durch zwei Datenpunkte dargestellt, die zu den repräsentativen Datenpunkten des Behälters im visuellen Element werden. Die Datenpunkte sind der hohe und niedrige Wert für diesen Bin. Durch die Auswahl hoher und niedriger Werte stellt der Binning-Prozess sicher, dass wichtige hohe oder signifikante niedrige Werte erfasst und in der Visualisierung dargestellt werden.
Wenn dieser Prozess nach viel Analyse klingt, um sicherzustellen, dass der gelegentliche Ausreißer in der Darstellung erfasst und ordnungsgemäß angezeigt wird, haben Sie recht. Das ist der genaue Grund für den Algorithmus und den Binning-Prozess.
Tooltips und Zeilenproben mit hoher Dichte
Der Binningprozess erfasst und zeigt den Minimal- und Maximalwert in einem bestimmten Bin an. Dieser Vorgang könnte die Darstellung der Daten in Tooltipps beeinflussen, wenn Sie mit dem Mauszeiger über die Datenpunkte fahren. Um zu erklären, warum und wie dieser Prozess die QuickInfos beeinflusst, betrachten wir unser Beispiel zu Aktienkursen erneut.
Sie erstellen ein visuelles Element basierend auf dem Aktienkurs, und Sie vergleichen zwei verschiedene Aktien, die beide die Samplings mit hoher Dichte verwenden. Die zugrunde liegenden Daten für jede Datenreihe weisen viele Datenpunkte auf. Beispielsweise erfassen Sie den Aktienkurs jede Sekunde des Tages. Der Samplingalgorithmus mit hoher Dichte führt die Binning für jede Datenreihe unabhängig vom anderen durch.
Nun springt die erste Aktie um 12:02 Uhr nach oben und kommt 10 Sekunden später schnell zurück. Das ist ein wichtiger Datenpunkt. Wenn Binning für diese Aktie auftritt, ist der hohe Kurswert um 12:02 ein repräsentativer Datenpunkt für dieses Intervall.
Für die zweite Aktie ist 12:02 jedoch kein Hoch oder Tief in dem Intervall, das diese Zeit enthält. Vielleicht könnten die Höchst- und Tiefstwerte für den Bereich, der 12:02 umfasst, drei Minuten später auftreten. In dieser Situation, wenn das Liniendiagramm bereits erstellt ist und Sie mit dem Mauszeiger über 12:02 fahren, wird ein Wert in der QuickInfo für die erste Aktie angezeigt. Dieser Wert ist vorhanden, da die erste Aktie um 12:02 uhr springt und der Algorithmus diesen Wert als hoher Datenpunkt des Bins auswählt. Für die zweite Aktie sehen Sie jedoch keinen Wert im Tooltip um 12:02. Die zweite Aktie hatte kein Hoch oder Tief für das Intervall, das um 12:02 Uhr enthalten war. Da es keine Daten gibt, die für die zweite Aktie um 12:02 angezeigt werden, werden auch keine Tooltip-Daten dargestellt.
Diese Situation tritt häufig mit QuickInfos auf. Die hohen und niedrigen Werte für eine bestimmte Bin passen wahrscheinlich nicht genau zu den gleichmäßig skalierten X-Achsen-Wertpunkten, sodass der Tooltip den Wert nicht anzeigt.
Einschalten der hochdichten Linienprobennahme
Standardmäßig ist der Algorithmus aktiviert. Um diese Einstellung zu ändern, wechseln Sie zum Bereich "Formatierung ", in der Karte " Allgemein " und unten sehen Sie den Schieberegler für das Sampling mit hoher Dichte . Wählen Sie den Schieberegler aus, um ein- oder auszuschalten.
Überlegungen und Einschränkungen
Der Algorithmus für das Sampling mit hoher Dichte ist eine wichtige Verbesserung von Power BI, aber es gibt einige Überlegungen, die Sie beim Arbeiten mit Werten und Daten mit hoher Dichte wissen müssen.
- Aufgrund der erhöhten Granularität und des Binning-Prozesses zeigen QuickInfos möglicherweise nur einen Wert an, wenn die repräsentativen Daten auf Ihren Cursor treffen. Weitere Informationen finden Sie im Abschnitt "QuickInfos und Stichproben mit hoher Dichte" in diesem Artikel.
- Wenn die Größe einer gesamtdatenquelle zu groß ist, beseitigt der Algorithmus Datenreihen (Legendenelemente), um die maximale Einschränkung des Datenimports zu berücksichtigen.
- In dieser Situation sortiert der Algorithmus legendenreihen alphabetisch. Es beginnt mit der Liste der Legendenelemente in alphabetischer Reihenfolge, bis das Datenimport-Maximum erreicht ist, und keine weiteren Serien importiert werden.
- Wenn ein zugrunde liegendes Dataset über mehr als 60 Datenreihen verfügt, sortiert der Algorithmus die Datenreihe alphabetisch und entfernt Datenreihen über die 60. alphabetisch sortierte Datenreihe hinaus.
- Wenn die Werte in den Daten keine numerischen oder Datums-/Uhrzeittypen sind, verwendet Power BI den Algorithmus nicht und kehrt zum vorherigen Algorithmus mit nicht-hochdichter Stichprobe zurück.
- Die Elemente ohne Dateneinstellung anzeigen werden vom Algorithmus nicht unterstützt.
- Der Algorithmus wird nicht unterstützt, wenn eine Liveverbindung mit einem modell verwendet wird, das in SQL Server Analysis Services, Version 2016 oder früher, gehostet wird. Es wird in Modellen unterstützt, die in Power BI oder Azure Analysis Services gehostet werden.