Les champs calculés dans le Tableau - clairement et simplement

Précédent ◈ Suivant

Dès que vos données et analyses avec visualisations Tableau Software deviennent plus complexes, vous trouverez bientôt que, parfois, votre source de données ne comprend pas toutes les mesures et les dimensions dont vous avez besoin.

L'un des exemples les plus courants est un ensemble de données, y compris les mesures recettes et les coûts, mais il manque un champ de profit.

C'est là les champs calculés de Tableau entrent en jeu. Cette fonctionnalité vous permet d'ajouter de nouveaux champs en fonction des dimensions et des mesures de votre source de données et / ou en fonction d'autres champs calculés.

Si vous êtes intéressé par l'analyse des données professionnelles et en utilisant visualisations Tableau Software, vous ne pourrez pas sortir d'utiliser tôt ou tard champs calculés.

Que des champs calculés dans le Tableau?

Comme mentionné dans l'introduction, dans la plupart des cas, vos données sources ne fournissent pas tous les champs dont vous avez besoin pour répondre à toutes vos questions. Les champs calculés de Tableau vous aidera à créer toutes les dimensions et les mesures nécessaires à votre analyse.

Une fois définis, les champs calculés sont disponibles dans le classeur entier tant que les feuilles de calcul utilisent la même source de données. Vous pouvez utiliser les champs calculés de la même manière que vous utilisez les dimensions et les mesures de vos données source.

Comment créer et utiliser des champs calculés dans le Tableau

Voici comment faire un tutoriel sur les champs calculés en bref:

Cliquez sur l'analyse dans le menu principal ou faites un clic droit sur une dimension ou mesure et sélectionnez Créer champ calculé

La fenêtre de dialogue suivante apparaît:

Définissez un nom pour votre champ calculé

Tapez la formule pour définir votre champ calculé

champs Insérer
Vous voyez tous les champs de la source de données et tous les champs calculés (si vous avez déjà défini certains) dans une zone appelée « Champs » en bas à gauche de la fenêtre. Double-cliquer sur un de ces champs, il insère dans votre formule ci-dessus.
Insérer une fonction
La zone « Fonctions » affiche toutes les fonctions disponibles pour les champs calculés. S'il vous plaît noter que les opérateurs arithmétiques de base ne sont pas inclus ici. Encore une fois un double-clic sur une fonction insère dans votre formule. La liste déroulante des filtres ci-dessus la liste des fonctions par catégorie et le texte à droite il fournit une brève information sur la façon d'utiliser la fonction sélectionnée.

Cliquez sur le bouton « Check Formula » pour vous assurer que votre calcul est valide et peut être utilisé directement dans votre classeur.

Enfin, cliquez sur OK pour créer le champ calculé.

Maintenant, vous voyez: votre nouveau champ calculé apparaît immédiatement dans la fenêtre de données sur la gauche, soit comme une dimension ou une mesure, en fonction du résultat de votre formule. Tableau identifie automatiquement si votre champ calculé est une dimension (à savoir renvoie une chaîne) ou une mesure (par exemple renvoie un nombre). Tableau reconnaît même si votre champ calculé renvoie une date et montre cela avec le symbole de calendrier dans la zone de dimensions.

C'est tout. Création d'un champ calculé est pas sorcier. Bien sûr, vous devez vous habituer aux noms des fonctions disponibles et la façon de les utiliser. Cependant, les noms de fonction et leur utilisation sont très souvent assez similaires aux fonctions Microsoft Excel. Si vous pouvez écrire la formule dans Excel, vous pouvez également écrire dans un champ calculé dans le Tableau.

Pour plus de détails sur les champs calculés Je recommande la lecture du manuel Tableau hors ligne (télécharger le fichier pdf ici 16.5MB).

3 recommandations simples pour l'utilisation des champs calculés

Voici 3 conseils supplémentaires pour la création et le maintien de champs calculés:

Utilisez un nom descriptif
Après avoir créé un champ calculé, attribue un nom Tableau par défaut comme « calcul1 ». Prenez quelques secondes pour remplacer cela par un parlant, nom descriptif comme « Distance » ou « URL_LINK ». Cela permet d'améliorer la lisibilité et la maintenabilité de votre classeur.

entre crochets
Si vous cliquez deux fois sur une dimension ou une mesure dans la zone des champs, ce champ insère Tableau entre crochets par défaut (par exemple [fieldname]). Tant que le nom du champ ne contient pas de vide, vous pouvez supprimer les crochets. Si vous écrivez des formules plus complexes en utilisant beaucoup de parenthèses, cela est parfois utile d'améliorer la lisibilité de la formule.

La vitrine d'aujourd'hui est une visualisation des zones de chalandise en Allemagne. Supposons que nous voulons trouver l'emplacement d'un nombre maximum de résidents vivant à une distance de Beeline de moins de 150 kilomètres.

Faire une supposition. Quelle est votre première estimation? Berlin? Hambourg? Francfort? Munich? Pas assez.

Avez-vous déjà entendu parler de Kirchhundem. Non? Ne vous inquiétez pas, je vis en Allemagne et je jamais entendu parler auparavant. Cependant, il semble être le cœur de l'Allemagne, au moins en ce qui concerne notre question de la zone de chalandise maximale. Près de 27 millions de personnes, à savoir près d'un tiers de la population totale de l'Allemagne vit à une distance de moins de 150 km de Kirchhundem (à vol d'oiseau).

La vitrine de Tableau d'aujourd'hui permet une analyse de la zone desservie comme celui-ci, y compris les différents visualisations.

Les champs calculés dans l'affaire Afficher

Il est certainement impossible de couvrir tous les aspects et les possibilités de champs calculés dans un exemple ou un cas d'exposition. Cependant, j'ai essayé de faire de mon mieux pour trouver un exemple intéressant, y compris autant de types de champs calculés que possible.

Voici les types et les champs calculés utilisés dans le spectacle cas:

Définition des constantes

Les champs calculés n'utilisent pas nécessairement une formule. Vous pouvez également définir une constante hardcoded en tapant simplement un numéro ou une chaîne. Voici les constantes définies dans les champs calculés dans la vitrine:

Le rayon est une constante utilisée dans un autre champ calculé appelé [Distance]. Il est le rayon de la terre en kilomètres (6371). Il est logique d'avoir ce champ calculé séparément, car il est plus commode de changer la constante ici (par exemple passer à miles au lieu de kilomètres) au lieu d'être obligé de changer toutes les formules dans tous les domaines calculés sur la base de cette constante.

Bien sûr, vous pouvez faire des calculs mathématiques simples dans les champs calculés ainsi. Dans le cas d'exposition, par exemple, [Population en% du total] calcule la population dans le rayon choisi en pour cent de la population totale de l'Allemagne:

Le numérateur de la fraction est la mesure [Population] de la source de données, le dénominateur est un autre champ calculé appelé [Total_Population_Germany] (voir définition ci-dessous).

Parfois, vous devez faire des conversions de types de mesures dans votre source de données. Encore une fois, les champs calculés sont un moyen facile de faire cela. Dans la source de notre show case de données, les codes postaux [PLZ5] sont stockés sous forme de nombres. Ceci est un problème, car il y a des codes postaux commençant par un zéro. Stocké comme un nombre, par exemple, le premier code postal est 01067 1067 au lieu de (Dresde). Nous pouvons corriger cela avec un champ calculé. Nous convertissons le numéro dans une chaîne et d'ajouter un zéro si nécessaire:

Si LEN (STR (INT (PLZ5))) = 4 Ensuite,
"0" + STR (INT (PLZ5))
Autre
STR (INT (PLZ5))
Fin

Nous utilisons exactement la même formule dans [Center_PLZ5_str] pour convertir le code postal de l'emplacement central dans une chaîne de 5 caractères.

Créer un champ supplémentaire basé sur un champ dans la source de données

Les données de géocodage analyses en Allemagne utilisent bien souvent les soi-disant PLZ2, à savoir les 2 premiers chiffres des codes postaux allemands, qui divise l'Allemagne en 95 régions. Étant donné que nous n'avons pas ce champ disponible dans la source de données, nous utilisons un champ calculé pour le créer basé sur le champ calculé [PLZ5_str]:

Pour naviguer dans la vue Google Map à l'URL correcte, nous avons besoin d'une chaîne dynamique en fonction de la latitude et la longitude de l'emplacement choisi. Je l'ai déjà décrit cette idée dans l'article récent La puissance des actions Tableau.

2 chaînes codées dur au début et à la fin sont concaténés avec [Latitude] et [Longitude] converties en chaînes.

Création de nouvelles catégories

Si vous avez besoin de diviser vos données en différentes catégories qui ne sont pas inclus dans vos données source, vous pouvez créer une nouvelle catégorie avec un champ calculé. Dans notre vitrine, nous voulons séparer les lieux (codes postaux) dans l'emplacement défini comme le centre et tous les autres lieux:

Si Lat_Center = Latitude et Longitude Long_Center = Alors
"Centre"
Autre
"Autre location"
Fin

Les champs calculés [Lat_Center] et [Long_Center] (voir définition) coup sont comparés aux champs [Latitude] et [Longitude] dans la source de données. Si les deux sont égaux [LOCATION_TYPE] est réglé sur « Centre », sinon [LOCATION_TYPE] est « Autre emplacement ». En utilisant [LOCATION_TYPE] sur le plateau de couleur de la carte nous permet de visualisations mettre en évidence le centre sélectionné en rouge.

Comme décrit ci-dessus, nous voulons mettre en évidence le centre sur la carte. Cependant, en utilisant [LOCATION_TYPE] sur le plateau de couleur ne suffit pas. Depuis [la population] est sur le plateau de la taille, vous ne verrez pas l'emplacement du centre si elle est une ville relativement petite. Ainsi, nous allons faire une petite manipulation de données. Nous augmentons la population du centre à 100.000 habitants hardcoded. Ainsi, nous nous assurons que le centre est visible sur la carte:

Si [LOCATION_TYPE] = "center" Alors
100000
Autre
Population
Fin

sonne mal et le plus souvent il est la manipulation des données. Mais cette petite astuce ne dénature pas nos visualisations et des analyses. Nous utilisons [Map_Population] uniquement sur la plate-forme de taille de la carte. Tous les autres calculs et la visualisation sont basés sur le champ source de données [Population]. Ainsi, nous nous assurons de calculer et de visualiser les chiffres corrects. S'il vous plaît noter que nous avons même changé l'info-bulle sur la carte pour montrer [Population] au lieu de [Map_population]. Vous voyez: notre manipulation de données peu sale n'a aucune influence sur la précision de nos résultats.

mathématiques plus complexes

Les champs calculés peuvent également être utilisés pour faire des mathématiques plus complexes. Et dans notre vitrine, nous devons: on calcule la distance approximative entre le centre et tout autre endroit en utilisant la loi sphérique de cosinus:

distance = R * acos (sin (LAT1) * sin (LAT2) + cos (LAT1) * cos (LAT2) * cos (long2-long1))

Cette formule est basée sur la (mauvaise) hypothèse d'une terre sphérique, à savoir aucun effet ellipsoïdales considéré. Cependant, les erreurs résultant de moins de 0,5% sont négligeables.

Je ne vais pas entrer dans les détails de cette formule. Vous pouvez trouver beaucoup de ressources sur le net expliquant la formule et les alternatives possibles.

ROND ([Rayon] * ACOS (NAS (radians (Lat_Center)) * NAS (radians (Latitude)) + COS (radians (Lat_Center)) * COS (radians (Latitude)) * COS (radians (Longitude) - radians (Long_Center ))), 2)

Accès direct aux données source via SQL

Ce type de champs calculés a besoin d'un savoir-faire SQL. Tableau de soi-disant « passer à travers » fonctions vous permettent d'accéder directement à la source de données dans un champ calculé par exemple pour contourner les filtres définis utilisés dans votre classeur.

Par exemple: nous voulons montrer la somme de la population filtrée en% de la population totale. Étant donné que nous utilisons [Distance] en tant que filtre global, on ne peut pas se rendre à la population totale de l'Allemagne sans accès direct à la source de données dans un champ calculé:

RAWSQL_REAL ( 'SELECT SUM ( "Population") de "TableauExtract")

Ce passage à travers l'instruction extrait le nombre total de la population allemande sans tenir compte des filtres définis dans le classeur.

De plus, nous avons besoin de deux autres passent par des fonctions pour trouver la latitude et la longitude de l'emplacement du centre sélectionné. Cette fois-ci est une instruction SELECT ENDROIT OÙ avec [PLZ5_Center] (code postal de l'emplacement du centre) comme condition WHERE:

RAWSQL_REAL
( 'SELECT "latitude" FROM "TableauExtract" OU "PLZ5" =% 1', INT (Center_PLZ5))

RAWSQL_REAL ( 'SELECT "Longitude" FROM "TableauExtract" OU "PLZ5" =% 1', INT (Center_PLZ5))

Comme je l'ai dit, pas tous les types possibles de champs calculés est couvert dans le cas d'exposition, mais ces exemples devraient vous donner un début de saut.

Mettre en place le classeur et les Tableau visualisations

Après avoir créé les champs calculés, la mise en place du reste du classeur et le Tableau est un morceau visualisations de gâteau:

Créer une carte avec [LOCATION_TYPE] sur le plateau de couleur, [Map_population] sur le plateau de taille et [Distance] comme à la plus filtre. Enfin changer le titre de la carte pour inclure le filtre et le code postal de l'emplacement du centre

Faire [Distance] un filtre global

Ajouter 3 feuilles pour afficher un numéro unique en utilisant la plate-forme de texte (endroits, la population et la population en% du total)

Ajouter 3 feuilles de travail pour visualiser SUM ([Population]) par l'Etat, PLZ5 (de code postal complet) et PLZ2 (2 premiers chiffres du code postal) à l'aide de graphiques à barres. Définir un ordre de tri prédéfini décroissant par SUM ([Population])

Créer un tableau de bord pour afficher toutes les visualisations et le filtre à distance sur une page. Ajouter une page Web pour le tableau de bord pour afficher la vue Google Map # 0160;

Enfin la mise en œuvre 3 différentes actions de tableau de bord pour améliorer l'interactivité avec le filtrage, mise en évidence et la mise à jour de la vue Google Map à la volée. À peu près exactement ce qui a été décrit dans l'article récent La puissance des actions de Tableau

Vous voyez: rien de nouveau sous le soleil. Les suspects habituels de développement des classeurs de tableau et les tableaux de bord.

Le mauvais côté

Si vous voulez voir la zone de chalandise d'un autre emplacement, vous devez remplacer la constante dans le champ calculé [Center_PLZ5] par le code postal de l'emplacement souhaité.

Puisque vous devez modifier le champ calculé, vous ne pouvez pas le faire en utilisant Tableau Reader. Vous avez besoin Tableau Desktop installé sur votre ordinateur.

Les résultats - quelques captures d'écran sélectionnés

Voici quelques captures d'écran du tableau de bord exemple. Pour un rayon de 150 kilomètres, Kirchhundem remporte la course pour la plupart des résidents d'une distance inférieure à 150 kilomètres:

Au bas de l'échelle, nous trouvons Dranske sur l'île de Rügen:

Vous voyez la différence: près de 27 millions de personnes dans un rayon de 150 km autour Kirchhundem, mais seulement 1,3 millions d'habitants de la même distance autour de Dranske.

Le lien de téléchargement

J'aurais aimé de publier ce sur Tableau Public et le rendre disponible pour un accès direct ici sur mon blog. Cependant, Tableau ne supporte pas public les classeurs en utilisant des instructions SQL personnalisées. Ainsi, je ne peux pas poster le classeur emballé pour téléchargement gratuit:

Remerciements

Un grand merci encore à Giedre Aleknonyte pour revoir mon cahier de travail avant la publication et pour ses contributions et suggestions - précieuses, comme toujours. S'il vous plaît visitez le blog de Giedre add connaissance et la suivre sur Twitter. Merci, Giedre.

Je voudrais également remercier Emil Bruusgaard pour me donner l'idée de cet article. Je soupçonne que Emil n'a même pas remarqué que je pris cette inspiration de nous travailler ensemble sur son projet récemment Tableau. Mais je l'ai fait et ce poste est le résultat. Merci, Emil.

Et après?

| | |

Les champs calculés dans le Tableau

L'un des exemples les plus courants est un ensemble de données, y compris les mesures recettes et les coûts, mais il manque un champ de profit.

Si vous êtes intéressé par l'analyse des données professionnelles et en utilisant visualisations Tableau Software, vous ne pourrez pas sortir d'utiliser tôt ou tard champs calculés.

Articles Liés

Précédent ◈ Suivant