相关文章推荐
小百科
›
Tableau Prep 入门指南 - Tableau
入门指南
tableau
慈祥的热水瓶
8 月前
</noscript><div id="app" class="wrapper"><header id="tableau-help-article-header" class="container--full-width quick-help-header"><div class="container--centered"><div class="header__mobile-menu quick-help-hidden"><menu-tree-toggle/></div><div class="header__logo quick-help-hidden"><a id="tableau-logo" href="https://www.tableau.com/zh-cn/"><img src="./Resources/tableau-logo.png" class="header__logo__img" alt="Tableau"/></a></div><div class="header__search"><search-header-help placeholder="搜索"/></div></div></header><div class="container--navigation-top quick-help-hidden content-only-hidden"><div id="help-subheader" class="subheader print-hidden"><div class="container--centered"><h1 class="heading--subheader">Tableau Prep 帮助</h1></div></div><div class="container--top-links"><div class="container--centered container--breadcrumbs"><div><breadcrumb-links-help/></div></div><div id="help-container-menu-headings" class="container--menu-headings"><nav class="nav-medium-screen"><menu-heading-links-static-help menu-title="本文内容" :disabled="false" :headings="pageHeadings"/></nav></div></div></div><div class="section--main container--full-width"><div class="container--centered"><nav class="nav-side nav-side--left" role="navigation"><menu-tree-help menu-title="内容"/></nav><article role="main"><h2 class="topic--title" id="topic-title" tabindex="-1">Tableau Prep Builder 入门指南</h2><div class="caption article__tags content-only-hidden quick-help-hidden"><span class="article__tags--applies-to"> </span><br/><span class="article__tags--role"> </span></div><div id="content-body"> <div id="mc-main-content"><p class="note"><b>注意</b>:从版本 2020.4.1 开始,作为 Creator,您还可以在 Web 上创建和编辑流程。本教程是使用 Tableau Prep Builder 设计的,但也可以在 Web 上完成,不过有一些值得注意的例外。</p><p>本教程介绍 Tableau Prep 中的常见操作。您将使用 Tableau Prep 附带的样本数据集来演练为示例 Superstore 创建流程。本教程使用最新版本的 Tableau Prep Builder。如果您使用的是以前的版本,结果可能会不同。</p><p>请在进行演练的过程中观看提示,深入了解 Tableau Prep 如何帮助您清理和调整数据以进行分析。</p><p>若要在继续本教程之前安装 Tableau Prep Builder,请参见 Tableau Desktop 和 Tableau Prep Builder 部署指南中的<a href="https://help.tableau.com/current/desktopdeploy/zh-cn/desktop_deploy_download_and_install.htm" target="_blank">通过用户界面安装 Tableau Desktop 或 Tableau Prep Builder<span class="sr-only">(链接在新窗口中打开)</span></a>。否则您可以下载<a href="https://www.tableau.com/zh-cn/products/prep/download" target="_blank">免费试用版<span class="sr-only">(链接在新窗口中打开)</span></a>。</p><h4><a name="sample_files"/>示例文件</h4><p>若要完成本教程中的任务,您需要安装 Tableau Prep Builder,或者如果在服务器版本 2020.4 或更高版本上启用了 Web 制作,还可以尝试 Web 上的步骤。</p><p>在计算机上安装 Tableau Prep Builder 后,您还可以在以下位置找到示例文件:<br/></p><ul><li>(Windows) <code>C:\Program Files\Tableau\Tableau Prep Builder <version>\help\Samples\en_US\Superstore Files</code></li><li>(Mac) <code>/Applications/Tableau Prep Builder <version>.app/Contents/help/Samples/en_US/Superstore Files</code></li></ul><p>或者,从这些链接下载示例文件,并创建一个 Samples 目录和一个 South 子目录。如果在 Web 上完成本教程,则需要这样做。</p><table style="width: 100%;"><colgroup><col style="width: 50%;"/><col style="width: 50%;"/></colgroup><thead><tr><th>下载到 Samples 目录</th><th>下载到 South 子目录</th></tr></thead><tbody><tr><td><ul><li><a href="https://mkt.tableau.com/PrepTutorials/Orders_Central.csv">Orders_Central</a></li><li><a href="https://mkt.tableau.com/PrepTutorials/Orders_East.xlsx">Orders_East</a></li><li><a href="https://mkt.tableau.com/PrepTutorials/Orders_West.csv">Orders_West</a></li><li><a href="https://mkt.tableau.com/PrepTutorials/return_reasons_new.xlsx">returns_reasons_new</a></li></ul></td><td><ul><li><a href="https://mkt.tableau.com/PrepTutorials/orders_south_2015.csv">Orders_South_2015</a></li><li><a href="https://mkt.tableau.com/PrepTutorials/orders_south_2016.csv">Orders_South_2016</a></li><li><a href="https://mkt.tableau.com/PrepTutorials/orders_south_2017.csv">Orders_South_2017</a></li><li><a href="https://mkt.tableau.com/PrepTutorials/orders_south_2018.csv">Orders_South_2018</a></li></ul></td></tr></tbody></table><h2 is="heading-item" :level="2" id="背景故事"><a name="Intro"/>背景故事...</h2><p>您在一家大型零售连锁店的总部工作。您的老板想要分析过去四年公司的产品销售额和利润。您推荐他使用 Tableau Desktop 来完成该操作。您的老板认为这个主意很棒,并希望您立即着手完成该工作。</p><p>在开始收集需要的所有数据时,您注意到,有人已经通过其他方式为每个区域收集和跟踪过数据。您还注意到不同文件中有大量创新数据条目,而且一个区域甚至每年都有单独的文件!</p><p>您将不得不先执行大量的数据清理工作,然后才能开始在 Tableau 中分析数据,而这项工作将需要很长时间。</p><p>在您翻找餐厅的菜单来订晚餐时,您想起来 Tableau 有一款名为 Tableau Prep 的新产品,该产品可帮助您完成艰巨的数据清理任务。</p><p>您下载产品,并注册了<a href="https://www.tableau.com/zh-cn/products/prep/download" target="_blank">免费试用版<span class="sr-only">(链接在新窗口中打开)</span></a>,决定试用一下。</p><h2 is="heading-item" :level="2" id="1连接到数据"><a name="Connect"/>1.连接到数据</h2><p>打开 Tableau Prep Builder 时,您首先看到是一个带有<span class="uicontrol">“连接”</span>窗格的开始页面,就像 Tableau Desktop 一样。</p><p><img src="Img/prep_startpage2.png" alt=""/></p><p>若要开始操作,第一步是连接到数据并创建输入步骤。您将从该处开始创建工作流(在 Tableau Prep 中称之为“流程”),并随着进展添加更多步骤来对数据执行操作。</p><p class="note--tip"><b>提示</b>:输入步骤是数据的摄入点和流程的开始点。您可能有多个输入步骤,并且某些步骤可能包括多个数据文件。有关连接到数据的详细信息,请参见<a href="prep_connect.htm" target="_blank" class="MCXref xref">连接到数据<span class="sr-only">(链接在新窗口中打开)</span></a>。</p><p>不同区域的销售额数据文件以不同的格式存储,并且“南部”区域的订单实际上是多个文件。您检查了<span class="uicontrol">“连接”</span>窗格,并发现您有很多选择来连接到数据。太好了!</p><p>由于其他区域全部四年的数据是一个文件,因此您决定先 着手处理“南部”区域的文件。</p><ol><li value="1"><p>在<span class="uicontrol">“连接”</span>窗格上,单击<span class="uicontrol">“添加连接”</span><img src="Img/prep_addconnection.png" alt=""/> 按钮。</p><p>在 Web 制作中,从<span class="uicontrol">“主页”</span>中单击<span class="uicontrol">“创建”</span>><span class="uicontrol">“流程”</span>,或从<span class="uicontrol">“浏览”</span>页面中单击<span class="uicontrol">“新建”</span>><span class="uicontrol">“流程”</span>。然后单击<span class="uicontrol">“连接到数据”</span>。</p></li><li value="2"><p>文件是 .csv 文件,因此请在连接列表中选择<span class="uicontrol">“文本文件”</span>。</p></li><li value="3"><p>导航到您的文件的目录。在 Orders South 子目录中,选择第一个文件 <b>orders_south_2015.csv</b>,并单击<span class="uicontrol">“打开”</span>以将其添加到流程。(有关文件位置,请参见<a href="#Wrap" class="MCXref xref">总结和资源</a>。)</p><p>连接到第一个文件后,Tableau Prep Builder 工作区将打开,您会看到它分为两个主要部分。顶部的“<b>流程</b>”窗格和底部的“<b>输入</b>”窗格。</p><p><img src="Img/prep_get_started_step3.png" alt=""/></p><p>与 Tableau Desktop 很像,“<b>流程</b>”窗格是您的工作区,您可以在其中直观地与数据交互并构建流程。“<b>输入</b>”窗格包含有关如何摄入数据的配置选项。它还显示数据集中的字段、数据类型以及值的示例。</p><p>我们将在下一部分中探讨您如何才能与此数据交互。</p><p class="note--tip"><b>提示:</b>对于单个表,Tableau Prep 会在您将数据添加到流程时自动为您在<b>“流程”</b>窗格中创建输入步骤。否则,您可以使用拖放功能将表添加到<span class="uicontrol">“流程”</span>窗格。</p></li><li value="4"><p>在南方,您还有另外三个订单文件,如何组合它们取决于您在哪里工作。</p><p style="font-weight: bold;">在 Tableau Prep Builder 中:</p><ol style="list-style-type: lower-alpha;"><li value="1">您可以单独添加每个文件,但您想要将所有文件合并到一个输入步骤中,因此您在“<b>输入</b>”窗格中单击<span class="uicontrol">“表”</span>选项卡。</li><li value="2"><p>您会看到一个<span class="uicontrol">“合并多个表”</span>选项。选择该选项。</p><p>您注意到,您在其中选择文件的目录已填充,并且您需要的其他文件列在“输入”窗格的<span class="uicontrol">“已包括文件”</span>部分中。</p><p class="note--tip"><b>提示</b>:使用通配符并集可以非常方便的连接到单一数据源中具有类似名称和结构的多个文件并将其合并。若要使用此选项,文件必须位于同一父目录或子目录中。如果没有立即看到所需的文件,请更改搜索条件。有关详细信息,请参见<a href="prep_add_input_data.htm#Union" target="_blank" class="MCXref xref">在输入步骤中合并文件和数据库表<span class="sr-only">(链接在新窗口中打开)</span></a>。</p><p><img src="Img/prep_get_started_step4.png" alt=""/></p></li><li value="3"><p>单击<span class="uicontrol">“应用”</span>以将这些文件中的数据添加到<span class="uicontrol">“orders_south_2015”</span>输入步骤。</p></li><li value="4"><p>其他区域的文件全部都是单一表文件,因此您可以一次性选择所有文件并将它们添加到流程。</p><p class="note"><b>注意:</b>在 Web 上,文件只能单独上载。</p></li></ol><p style="font-weight: bold;">在 Tableau Server 或 Tableau Cloud 中:</p><p>通配符选项目前对于 Tableau Server 或 Tableau Cloud 不可用。不过,您还是希望包括来自南方的所有文件并同样处理数据,因此将它们组合在一起是有意义的。</p><ol style="list-style-type: lower-alpha;"><li value="1">重复步骤 2 和 3 以添加 Orders South 子目录中的其他文件。</li><li value="2">将它们与合并步骤结合。(有关更多详细信息,请参见<a href="prep_add_input_data.htm#Union" target="_blank" class="MCXref xref">在输入步骤中合并文件和数据库表<span class="sr-only">(链接在新窗口中打开)</span></a>。)<ol style="list-style-type: lower-roman;"><li value="1"><p>将<span class="uicontrol">“Orders_South_2016”</span>拖到<span class="uicontrol">“Orders_South_2015”</span>上,并将其放在<span class="uicontrol">“并集”</span>选项上。</p><p><img src="Img/prep_pwa_union.png" alt=""/></p></li><li value="2"><p>将<span class="uicontrol">“Orders_South_2017”</span>拖到新的合并步骤上,并将其放在<span class="uicontrol">“添加”</span>上。 对最终文件重复此步骤。</p><p><img src="Img/prep_pwa_union2.png" alt=""/></p></li></ol></li></ol></li><li value="5"><p>添加其余文件。</p><p><b>在 Tableau Prep Builder 中:</b></p><ul><li>打开文件资源管理器或 Finder,并导航到文件的目录。按住 Ctrl 单击或按住 Cmd 单击 (MacOS),选择以下文件并将它们拖放到“<b>流程</b>”窗格上,将这些文件添加到流程。(有关文件位置,请参见<a href="#Wrap" class="MCXref xref">总结和资源</a>。)<ul><li>Orders_Central.csv</li><li>Orders_East.xlsx</li><li>Orders_West.csv</li></ul></li></ul><p class="note"><b>注意:</b>这些是不同的文件类型。如果您看不到所有这些文件,请确保您的文件资源管理器或 Finder 设置为查看所有文件类型。</p><p><img src="Img/prep_get_started_step5.png" alt=""/></p><p style="font-weight: bold;">在 Tableau Server 或 Tableau Cloud 中:</p><ul><li>按照步骤 2 和 3 添加 Orders_Central.csv 和 Orders_West.csv。</li><li>在<span class="uicontrol">“连接”</span>窗格上,单击<span class="uicontrol">“添加连接”</span><img src="Img/prep_addconnection.png" alt=""/> 按钮。单击 <b>Microsoft Excel</b> 并选择“<b>Orders_East.xlsx</b>”。</li></ul></li></ol><h3 is="heading-item" :level="3" id="检查您的工作:观看“连接到数据”的实际运行效果。">检查您的工作:观看“连接到数据”的实际运行效果。</h3><p><i>单击图像可重播</i></p><p><img src="Img/getStarted_add_files.gif" alt=""/></p><h2 is="heading-item" :level="2" id="2浏览数据"><a name="Explore"/>2.浏览数据</h2><p>既然您已将数据文件加载到 Tableau Prep,您很确定自己想要将所有文件合并在一起。但在执行该操作之前,不妨先检查一下这些文件,看看是否能找出任何问题。</p><p>在“<b>流程</b>”窗格中选择输入步骤时,您可能会看到用于引入数据的设置、所包括的字段以及值的预览。</p><p>在这里可以很方便地决定要在流程中包括多少数据,以及移除或筛选不需要的字段。您还可以更改未正确分配的任何数据类型。</p><p class="note--tip"><b>提示</b>:如果在处理大型数据集,Tableau Prep 会自动引入数据样本,从而最大限度提升性能。如果看不到预期数据,您可能需要调整样本。可在<span class="uicontrol">“数据样本”</span>选项卡上执行此操作。有关配置数据选项和样本大小的详细信息,请参见<a href="prep_configure_dastaset.htm#sample" target="_blank" class="MCXref xref">选择数据样本大小<span class="sr-only">(链接在新窗口中打开)</span></a>。</p><p>在<span class="uicontrol">“流程”</span>窗格中,当您选择每个步骤并查看每个数据集时,您注意到需要稍后修复的一些问题,以及一个可立即在<span class="uicontrol">输入</span>步骤中修复的问题。</p><ul><li><p>选择“<b>Orders_West</b>”输入步骤。</p><ul><li><p><span class="uicontrol">“State”(州)</span>字段使用州名称的缩写。其他文件则使用完整拼写,因此您将需要稍后修复该问题。</p></li><li><p>有许多以“<b>Right_</b>”开头的字段。这些字段似乎与其他字段重复。您不想在流程中包括这些重复字段。此问题可在<span class="uicontrol">“输入”</span>步骤中的此处修复:</p><p><b>若要立即修复此问题</b>,请清除以“<b>Right_</b>”开头的所有字段的复选框。这会指示 Tableau Prep 忽略这些字段,不将它们包括在流程中。</p><p><img src="Img/prep_get_started_Right.png" alt=""/></p><p class="note--tip"><b>提示:</b>当您在某个步骤中执行清理操作(比如移除字段)时,Tableau Prep 会在<span class="uicontrol">“更改”</span>窗格中跟踪您所做的更改,并在“流程”窗格中(以小图标的形式)添加注释来帮助您跟踪对数据所做的操作。对于“输入”步骤,也会向每个字段中添加注释。<br/></p></li></ul></li><li><p>在<span class="uicontrol">“流程”</span>窗格中,单击“<b>Orders_Central</b>”输入步骤将其选定。在<span class="uicontrol">“输入”</span>窗格中,您注意到以下问题:</p><ul><li><p>订单日期和发货日期在字段中已针对月、日和年分开。</p></li><li>某些字段的数据类型与其他文件中相同字段的数据类型不同。</li><li><p><span class="uicontrol">“Region”(区域)</span>没有字段。</p></li></ul><p>您将需要对这些字段执行一些清理操作,然后才能将此文件与其他文件合并。但您无法在<span class="uicontrol">“输入”</span>步骤中的此处修复该问题,因此记下来以便稍后进行</p></li><li><p>选择“<b>Orders_East</b>”输入步骤。</p><p>此文件中的字段看起来与其他文件完全一致。但<span class="uicontrol">“Sales”(销售额)</span>值似乎全部都包括了货币代码。您稍后也需要修复该问题。</p></li></ul><p>既然您已经确定了数据集中的一些问题,那么下一步是更仔细地检查您的数据并清理找到的任何问题,以便能够合并和调整数据,并生成可用于分析的输出文件。</p><h2 is="heading-item" :level="2" id="3清理数据"><a name="Clean"/>3.清理数据</h2><p>在 Tableau Prep 中,检查和清理数据是一个反复的过程。确定了要处理的数据集之后,下一步是检查该数据,并通过对数据应用各种清理、调整和合并操作来对其进行操作。您通过向流程中添加步骤来应用这些操作。有关清理选项的详细信息,请参见<a href="prep_clean.htm" target="_blank" class="MCXref xref">清理和调整数据<span class="sr-only">(链接在新窗口中打开)</span></a>。</p><p>根据您尝试进行的操作,步骤有多种风格。例如,在想要对字段应用像筛选、合并、拆分、重命名这样的清理操作时随时添加清理步骤。添加聚合步骤来对字段进行分组和聚合,并更改数据的详细级别。有关不同步骤类型及其用法的详细信息,请参见<a href="prep_build_flow.htm" target="_blank" class="MCXref xref">构建和组织流程<span class="sr-only">(链接在新窗口中打开)</span></a>。</p><p class="note--tip"><b>提示</b>:向流程中添加步骤时,会自动添加一条流程线将步骤相互连接在一起。您可以将这些流程线四处移动,并根据需要移除或添加流程线。<br/><br/>运行流程时,必须要有这些连接点,以便 Tableau Prep 知道哪些步骤已连接以及步骤在流程中的应用顺序。如果缺少流程线,则流程会中断并出现错误。</p><h3 is="heading-item" :level="3" id="清理-orderscentral">清理 Orders_Central</h3><p>为了解决之前发现的问题并确定是否还有任何其他问题,您首先向“<b>Orders_Central</b>”输入步骤中添加一个清理步骤。</p><ol><li value="1"><p>在<span class="uicontrol">“流程”</span>窗格中,选择<span class="uicontrol">“Orders_Central”</span>,执行以下操作之一:</p><ul><li>单击加号 <img src="Img/prep_addicon.png" alt=""/> 图标并添加清理步骤。根据您的版本,此菜单选项为<span class="uicontrol">“添加步骤”</span>、<span class="uicontrol">“添加清理步骤”</span>或<span class="uicontrol">“清理步骤”</span>。</li><li><p>单击建议的清理步骤(<span class="mc-variable Variables.TabsProductPrepBuilder variable">Tableau Prep Builder</span> 版本 2020.3.3 及更高版本以及在 Web 上)</p><p><img src="Img/prep_autoclean_step.png" alt=""/></p></li></ul><p>向流程中添加清理步骤时,工作区将发生变化,您将看到数据的详细信息。</p><p><img src="Img/prep_cleaningstep2.png" alt=""/></p><p>A. “流程”窗格、B. 工具栏、C. “配置”窗格、D. 数据网格</p><p>工作区现在分为三个部分:<span class="uicontrol">“流程”</span>窗格、带工具栏的<span class="uicontrol">“配置”</span>窗格和<span class="uicontrol">“数据”</span>网格。</p><p>“<b>配置</b>”窗格显示数据的结构,同时将字段值汇总到数据桶中,以便您能够快速查看相关值,并找出离群值和 null 值。<span class="uicontrol">“数据”</span>网格显示字段的行级别详细信息。</p><p class="note--tip"><b>提示</b>:<span class="uicontrol">“配置”</span>窗格中的每个字段都显示在配置卡上。使用每张卡上的<span class="uicontrol">“更多选项”</span><img src="Img/prep_moreoptions_icon.png" alt=""/> 菜单(在以前的版本中为下拉箭头)来查看和选择可用于该字段类型的不同清理选项。您也可以对字段值进行排序、更改数据类型、为字段分配数据角色,或在<span class="uicontrol">“数据”</span>网格中拖放配置卡和列以重新排列它们。</p><p style="font-weight: bold;">使用计算字段清理数据</p><p>此数据集缺少“<b>Region</b>”(区域)字段。由于其他数据集有此字段,因此您将需要添加此字段,以便能够稍后合并数据。您将需要使用计算字段来执行此操作。</p></li><li value="2"><p>在工具栏中,单击<span class="uicontrol">“创建计算字段”</span>。</p></li><li value="3"><p>在计算编辑器中,将计算字段命名为<b>“<b>Region</b>”</b>(区域)。然后输入 <strong>"Central"</strong>(包括引号),并单击“<b>保存</b>”。</p><p><img src="Img/prep_calc1.png" alt=""/></p><p>您能够使用计算字段来调整数据,这种灵活性让您非常喜欢。您非常高兴看到 Tableau Prep 使用与 Tableau Desktop 相同的计算编辑器语言。</p><p class="note--tip"><b>提示</b>:当您对字段和值进行更改时,Tableau Prep 会在左侧的<span class="uicontrol">“更改”</span>窗格跟踪所做的更改。同时,会向流程中的清理步骤和<span class="uicontrol">“配置”</span>窗格中的字段添加一个表示更改的图标(注释)。我们将在进行更多更改之后查看<span class="uicontrol">“更改”</span>窗格。</p><p>接下来,您需要解决单独订单日期和发货日期字段的问题。您需要将它们合并为两个单一字段,一个用于“<b>Order Date</b>”(订单日期),一个用于“<b>Ship Date</b>”(发货日期),使它们与其他数据集中的相同字段保持一致。确保表具有相同的字段将使您能够稍后使用并集来合并表。</p><p>您可以再次使用计算字段,通过一个轻松的步骤执行此操作。</p></li><li value="4"><p>在工具栏中,单击<span class="uicontrol">“创建计算字段”</span>,将<span class="uicontrol">“Order Year”(订单年份)</span>、<span class="uicontrol">“Order Month”(订单月份)</span>和<span class="uicontrol">“Order Day”(订单日)</span>字段合并为一个格式为“MM/DD/YYYY”的字段。</p></li><li value="5"><p>在计算编辑器中,将计算字段命名为“<b>Order Date</b>”(订单日期)。然后输入以下计算,并单击<span class="uicontrol">“保存”</span>:</p><p><code>MAKEDATE([Order Year],[Order Month],[Order Day])</code></p><p><img src="Img/prep_calc2.png" alt=""/></p><p>既然有了新的订单日期字段,那么您需要移除现有字段,因为您不再需要它们。</p><p><span class="uicontrol">“配置”</span>窗格中有很多字段。您注意到工具栏右上角的<span class="uicontrol">“搜索”</span>框。您不知道是否能使用该框来快速查找想要移除的字段。您决定试一下。</p></li><li value="6"><p>在<span class="uicontrol">“配置”</span>窗格的搜索框中,键入 <span class="uicontrol">Order</span>。</p><p><img src="Img/prep_searchprofile.png" alt=""/></p><p>Tableau Prep 将在视图中快速滚动名称中包含<span class="uicontrol">“Order”</span>的所有字段。太酷了!</p></li><li value="7"><p>按住 Ctrl 单击或按住 Cmd 单击 (MacOS),选择<span class="uicontrol">“Order Year”(订单年份)</span>、<span class="uicontrol">“Order Month”(订单月份)</span>和<span class="uicontrol">“Order Day”(订单日)</span>字段。然后右键单击所选字段,并从菜单中选择<span class="uicontrol">“移除字段”</span>(在以前的版本中为<span class="uicontrol">“移除字段”</span>)来移除它们。</p><p><img src="Img/prep_multiselect_fields.png" alt=""/></p></li><li value="8"><p>现在重复上面的步骤 4 至 7,为<span class="uicontrol">“Ship Date”(发货日期)</span>创建单一字段。自己尝试一下,或使用下面的步骤来帮助您。</p><ul><li><p>在工具栏中,单击<span class="uicontrol">“创建计算字段”</span>,将<span class="uicontrol">“Ship Year”(发货年份)</span>、<span class="uicontrol">“Ship Month”(发货月份)</span>和<span class="uicontrol">“Ship Day”(发货日)</span>字段合并为一个格式为“MM/DD/YYYY”的字段。</p></li><li><p>将该计算字段命名为“<b>Ship Date</b>”(发货日期),并输入计算 <code>MAKEDATE([Ship Year],[Ship Month],[Ship Day])</code>。然后单击<b>“保存”</b>。</p></li><li><p>移除<span class="uicontrol">“Ship Year”(发货年份)</span>、<span class="uicontrol">“Ship Month”(发货月份)</span>和<span class="uicontrol">“Ship Day”(发货日)</span>字段。搜索并选择字段,然后从菜单中选择<span class="uicontrol">“移除”</span>(在以前的版本中为<span class="uicontrol">“移除字段”</span>)来移除这些字段。</p></li></ul><p class="note--tip"><b>提示</b>:Tableau Prep 会将“配置”窗格中的数据汇总到数据桶中,帮助您快速查看数据的形状、查找离群值、找出字段之间的关系,等等。<br/><br/>在此方案中,订单日期和发货日期现在可按年份汇总。每个数据桶都表示从起始年份一月份到下一年一月份的一年,并带有相应标签。由于有处于 2018 年和 2019 年下半年的销售日期及发货日期,因此该数据的数据桶相应标有 2019 年和 2020 年年末。<br/><br/>若要将此视图更改为实际日期,请单击“配置”卡中的<span class="uicontrol">“更多选项”</span><img src="Img/prep_moreoptions_icon.png" alt=""/> 菜单(在以前的版本中为下拉箭头),并选择<span class="uicontrol">“详细信息”</span>。<br/><img src="Img/prep_bins_example.png" alt=""/></p><p style="font-weight: bold;">与字段直接交互来清理数据</p><p>您的数据一开始看起来很好。但在完成为订单日期和发货日期移除额外字段的操作后,您注意到<span class="uicontrol">“Discounts”(折扣)</span>字段有一些问题。</p><ul><li><p>系统为其分配了<span class="uicontrol">“字符串”</span>数据类型,而不是<span class="uicontrol">“数字(小数)”</span>数据类型。</p></li><li><p>对于无折扣的情况,字段值是<span class="uicontrol">“None”(无)</span>,而不是数字值。</p></li></ul><p>这将在合并文件时导致问题,因此最好也修复该问题。</p></li><li value="9"><p>清除搜索,并在搜索框中输入 <span class="uicontrol">disc</span> 来查找字段。</p></li><li value="10"><p>选择<span class="uicontrol">“Discounts”(折扣)</span>字段,双击字段值<span class="uicontrol">“None”(无)</span>,并将其更改为数字值<span class="uicontrol">“0”</span>。<br/></p></li><li value="11"><p>若要将<span class="uicontrol">“Discount”(折扣)</span>字段的数据类型从<span class="uicontrol">“字符串”</span>更改为<span class="uicontrol">“数字(小数)”</span>,单击<span class="uicontrol">“Abc”</span>,并从下拉菜单中选择<span class="uicontrol">“数字(十进制)”</span>。</p><p><img src="Img/prep_clean_change_type.png" alt=""/></p></li><li value="12"><p>最后为步骤命名,以帮助跟踪您在此步骤中进行的操作。在<span class="uicontrol">“流程”</span>窗格中,双击步骤名称<span class="uicontrol">“Clean 1”(清理 1)</span>,并键入<span class="uicontrol">“Fix dates/field names”(修复日期/字段名称)</span>。</p></li></ol><h4>查看您的更改</h4><p>您对此数据集进行了许多更改,并开始担心自己会不记得所进行的操作。在检查工作时,您看到<span class="uicontrol">“配置”</span>窗格的左侧有一个名为<span class="uicontrol">“更改”</span>的列。</p><p>您单击箭头将其打开,看到其中列出了您刚刚进行的每项更改,这让您很高兴。在您滚动浏览列表中的更改时,您注意到,您可以删除或编辑更改,甚至能将更改四处移动来改变所做更改的顺序。</p><p>您可以轻松地查找构建流程时在任何步骤中所做的更改,并对这些更改的顺序进行试验来最大程度地利用您的数据,这让您非常喜欢。</p><p><img src="Img/prep_clean_fix_dates.png" alt=""/></p><p/><h3 is="heading-item" :level="3" id="检查您的工作:观看“清理-orderscentral”的实际运行效果。">检查您的工作:观看“清理 Orders_Central”的实际运行效果。</h3><p><i>单击图像可重播</i></p><p/><div alt="" src="Img/prep_get_started_clean.gif" is="gif-player"/><p>既然已清理了一个文件,那么您将查看其他文件来确定需要修复的其他问题。</p><p>接下来您决定查看“<b>Orders_East</b>”的 Excel 文件。</p><h3 is="heading-item" :level="3" id="清理-orderseast">清理 Orders_East</h3><p>在查看“<b>Orders_East</b>”文件的字段时,除了“<b>Sales</b>”(销售额)之外,大多数字段看起来与其他文件一致。为了进一步查看并确定是否还有任何其他要解决的问题,您向“<b>Orders_East</b>”输入步骤中添加一个清理步骤。</p><ol><li value="1"><p>在<span class="uicontrol">“流程”</span>窗格中,选择“<b>Orders_East</b>”,并执行以下操作之一:</p><ul><li>单击加号 <img src="Img/prep_addicon.png" alt=""/> 图标并添加清理步骤。根据您的版本,此菜单选项为<span class="uicontrol">“添加步骤”</span>、<span class="uicontrol">“添加清理步骤”</span>或<span class="uicontrol">“清理步骤”</span>。</li><li>单击建议的清理步骤(<span class="mc-variable Variables.TabsProductPrepBuilder variable">Tableau Prep Builder</span> 版本 2020.3.3 及更高版本以及在 Web 上)。</li></ul><p>通过查看<span class="uicontrol">“Sales”(销售额)</span>字段,您很快发现随销售额数字一起包括了 <span class="uicontrol">USD</span> 货币代码,并且 Tableau Prep 已将这些字段值解读为字符串。</p><p>如果要获得准确的销售额数据,您将需要从此字段中移除货币代码,并更改数据类型。</p><p>修复数据类型很容易,您已经知道如何做了。但唯一的销售额数据行超过 2000 行,而修复每个单独的行来移除货币代码看起来很麻烦。</p><p>但这是 Tableau Prep,因此您决定检查下拉菜单,看看是否有用于修复此问题的选项。</p><p>当您单击“<b>Sales</b>”(销售额)字段的<span class="uicontrol">“更多选项”</span><img src="Img/prep_moreoptions_icon.png" alt=""/>(以前版本中的下拉箭头)时,您看到一个名为<span class="uicontrol">“清理”</span>的菜单选项,以及该选项下一个用于移除字母的选项。您决定尝试一下,看看该选项有什么用。</p></li><li value="2"><p>选择<span class="uicontrol">“Sales”(销售额)</span>字段。单击<span class="uicontrol">“更多选项”</span><img src="Img/prep_moreoptions_icon.png" alt=""/> 菜单(在以前的版本中为下拉箭头),并选择<span class="uicontrol">“清理”</span>><span class="uicontrol">“移除字母”</span>。</p><p><img src="Img/prep_removeletters.png" alt=""/></p><p>哇!该清理选项立即从每个字段中移除了货币代码。现在您只需要将数据类型从<span class="uicontrol">“字符串”</span>更改为<span class="uicontrol">“数字(小数)”</span>,此文件看起来就正常了。</p></li><li value="3"><p>单击<span class="uicontrol">“Sales”(销售额)</span>字段的数据类型,并从下拉列表中选择<span class="uicontrol">“数字(小数)”</span>来更改数据类型。</p><p><img src="Img/prep_clean_east2.png" alt=""/></p></li><li value="4"><p>文件的其余部分看起来很好。为清理步骤命名以跟踪您的工作。例如,命名为“<b>Change data type</b>”(更改数据类型)。</p></li></ol><p>接下来您将查看 <b>Orders_West</b> 的最后一个文件,看看是否有任何需要修复的问题。</p><h3 is="heading-item" :level="3" id="清理-orderswest">清理 Orders_West</h3><p>在您查看“<b>Orders_West</b>”文件的字段时,大多数字段看起来都与其他文件一致,但您记得看到过“<b>States</b>”(州)字段为值使用了缩写,而不是州名称的完整拼写。为了将此文件与其他文件合并,您将需要修复此问题。因此您向“<b>Orders_West</b>”输入步骤中添加一个清理步骤。</p><ol><li value="1"><p>在<span class="uicontrol">“流程”</span>窗格中,选择“<b>Orders_West</b>”,并执行以下操作之一:</p><ul><li>单击加号 <img src="Img/prep_addicon.png" alt=""/> 图标并添加清理步骤。</li><li>单击建议的清理步骤(<span class="mc-variable Variables.TabsProductPrepBuilder variable">Tableau Prep Builder</span> 版本 2020.3.3 及更高版本以及在 Web 上)。</li></ul></li><li value="2"><p>滚动或使用“搜索”来查找“<b>State</b>”(州)字段。</p><p>您将看到所有州名称值都使用简短缩写。此字段只有 11 个唯一的值。您可以手动更改每个值,但 Tableau Prep 是否可能有另一种方法来完成此操作?</p><p>您单击字段的<span class="uicontrol">“更多选项”</span><img src="Img/prep_moreoptions_icon.png" alt=""/> 菜单(以前版本中的下拉箭头),并看到一个名为“<b>对值进行分组</b>”(在以前的版本中为“分组和替换”)的选项。选择该选项时,您将看到若干选项:</p><ul><li><p>手动选择</p></li><li><p>发音</p></li><li><p>常用字符</p></li><li>拼写</li></ul><p>州名称的发音不相似,它们的拼写不正确,也没有共用相同的字符,因此您决定尝试<span class="uicontrol">“手动选择”</span>选项。</p><p class="note--tip"><b>提示</b>:您可以双击字段名称或字段值来编辑单个值。若要编辑多个值,您可以选择所有值,并使用右键单击菜单选项<span class="uicontrol">“编辑值”</span>。但如果要将一个或多个值映射到特定值,请使用下拉菜单中的<span class="uicontrol">“对值进行分组”</span>选项。<br/>有关对值进行编辑和分组的详细信息,请参见<a href="prep_clean.htm#editvalues" target="_blank" class="MCXref xref">编辑字段值<span class="sr-only">(链接在新窗口中打开)</span></a>。</p></li><li value="3"><p>选择<span class="uicontrol">“State”(州)</span>字段。单击下拉箭头,并选择<span class="uicontrol">“对值进行分组”</span>(以前版本中的“分组和替换”)><span class="uicontrol">“手动选择”</span>。</p><p><img src="Img/prep_group.png" alt=""/></p><p>一个两列的卡将打开。这是“<b>对值进行分组”编辑器</b>。左侧的列显示当前字段值,右侧的列显示可映射到左侧字段的字段。</p><p>您想要将州缩写映射到州名称的完整拼写版本,但在<span class="uicontrol">“Orders_West”</span>数据集中没有这些值。您不知道是否能直接编辑名称和在该处添加名称,因此您尝试了一下。</p></li><li value="4"><p>在左侧窗格的<b>“对值进行分组”编辑器</b>中,双击<span class="uicontrol">“AZ”</span>以突出显示值,并键入 <span class="uicontrol">Arizona</span>。然后按 <span class="uicontrol">Enter</span> 以添加更改。</p><p><img src="Img/prep_group2.png" alt=""/></p><p>Tableau Prep 为新值<span class="uicontrol">“Arizona”</span>创建了一个映射值,并自动将旧值<span class="uicontrol">“AZ”</span>映射到该值。如果您像这样输入了更多此区域的数据,那么为这些值建立映射关系将节省您的时间。</p><p class="note--tip"><b>提示</b>:您可以添加数据样本中没有的字段值,建立映射关系来组织数据。如果刷新数据源并添加了新数据,您可以将新数据添加到映射,而不是手动修复每个值。<br/><br/>当您手动添加数据样本中没有的值时,值将带有红点标记,可帮助您轻松识别该值。</p></li><li value="5"><p>重复这些步骤,将每个州都映射到其名称的完整拼写版本。</p><table class="table--stripes"><tbody><tr><td><strong>缩写</strong></td><td><strong>州名称</strong></td></tr><tr><td>AZ</td><td>Arizona</td></tr><tr><td>CA</td><td>California</td></tr><tr><td>CO</td><td>Colorado</td></tr><tr><td>ID</td><td>Idaho</td></tr><tr><td>MT</td><td>Montana</td></tr><tr><td>NM</td><td>New Mexico</td></tr><tr><td>NV</td><td>Nevada</td></tr><tr><td>OR</td><td>Oregon</td></tr><tr><td>UT</td><td>Utah</td></tr><tr><td>WA</td><td>Washington</td></tr><tr><td>WY</td><td>Wyoming</td></tr></tbody></table><p>然后,单击<span class="uicontrol">“完成”</span>关闭<span class="uicontrol">“对值进行分组”</span>编辑器。</p><p><img src="Img/prep_clean_west2.png" alt=""/></p><p>映射了所有州之后,您查看<span class="uicontrol">“更改”</span>窗格,看到其中只有一个条目,而不是 11 个条目。</p><p>Tableau Prep 已将字段的类似操作分组在一起。您喜欢该功能,因为利用它可以更轻松地查找随后对数据集所做的更改。</p><p>修复“<b>State</b>”(州)字段值是您需要在此处进行的唯一更改。</p></li><li value="6"><p>为清理步骤命名以跟踪您的工作。例如“<b>Rename states</b>”(重命名州)。</p></li></ol><p>您在文件中进行了大量的清理,不敢相信操作能如此快捷轻松地完成。您竟然还可以回家吃晚饭!为了确保不会丢失到目前为止所做的工作,请保存您的流程。</p><p class="note"><b>注意</b>:如果在 Web 上工作,更改会在您移动时自动保存,从而创建草稿流程。单击草稿标题以命名草稿。有关在 Web 上制作的详细信息,请参见 <a href="https://help.tableau.com/current/server/zh-cn/prep_web_auth.htm" target="_blank">Tableau Server<span class="sr-only">(链接在新窗口中打开)</span></a> 或 <a href="https://help.tableau.com/current/online/zh-cn/prep_web_auth.htm" target="_blank">Tableau Cloud<span class="sr-only">(链接在新窗口中打开)</span></a> 帮助中的<b>“Web 上的 Tableau Prep”</b>。</p><p>单击<span class="uicontrol">“文件”</span>><span class="uicontrol">“保存”</span>或“<b>文件</b>”>“<b>另存为</b>”。将文件另存为流程文件 (.tfl) 并为其命名。例如“<b>My Superstore</b>”(我的超市)。</p><p class="note--tip"><b>提示</b>:在保存流程文件时,您可以将它们另存为流程文件 (.tfl) 或打包文件 (.tflx),并将本地数据文件与这些文件打包在一起,以便将流程和文件与其他人共享。有关保存和共享流程的详细信息,请参见<a href="prep_save_share.htm" target="_blank" class="MCXref xref">保存和共享工作<span class="sr-only">(链接在新窗口中打开)</span></a>。</p><h2 is="heading-item" :level="2" id="4合并数据"><a name="Combine"/>4.合并数据</h2><p>既然清理了所有文件,那么您就已最终准备好将它们合并在一起。</p><p>由于清理后所有文件都有类似的字段,因此若要将所有行合并到单个表中,您需要将这些表合并。</p><p>您记得有一个名为<span class="uicontrol">“并集”</span>的步骤选项,但不知道是否能简单地通过拖放步骤来合并文件。您决定试一下看看。</p><h3 is="heading-item" :level="3" id="合并数据">合并数据</h3><ol><li value="1"><p>针对您的工作位置执行相关步骤。</p><p><b>Tableau Prep Builder</b></p><ul><li><p>在<span class="uicontrol">“流程”</span>窗格中,将清理步骤“<b>Rename states</b>”(重命名州)拖到清理步骤“<b>Changed data type</b>”(更改的数据类型)步骤,并将其放在<span class="uicontrol">“并集”</span>选项上。</p><p><img src="Img/prep_drag_union.png" alt=""/></p><p>您看到 Tableau Prep Builder 向流程中添加了一个新的<span class="uicontrol">“Union”(合并)</span>步骤。太好了!现在,您想要向此并集中添加其他文件。</p></li></ul><p><b>Tableau Server 或 Tableau Cloud</b></p><ul><li><p>在<span class="uicontrol">“流程”</span>窗格中,将清理步骤“<b>Rename states</b>”(重命名州)拖到之前为 South 文件创建的“并集”步骤,并将其放在<span class="uicontrol">“添加”</span>选项上。</p><p><img src="Img/prep_pwa_union3.png" alt=""/></p><p>您会看到 Tableau Prep 将新文件添加到以前的并集中。太好了!现在,您想要向此并集中添加其他文件。</p></li></ul></li><li value="2"><p>将流程中的下一个清理步骤拖到新的<span class="uicontrol">“并集”</span>步骤,然后将其放在<span class="uicontrol">“添加”</span>上以添加到现有并集。</p><p><img src="Img/prep_add_join.png" alt=""/></p></li><li value="3"><p>将其余步骤(如果在 Tableau Prep Builder 中工作,为<span class="uicontrol">“orders_south_2015”</span>输入步骤,如果在 Web 上工作,则为您的清理步骤)拖到新的<span class="uicontrol">“并集”</span>步骤。将其放在<span class="uicontrol">“添加”</span>上以添加到现有并集。</p><p>现在,所有文件已合并到一个表中。在<span class="uicontrol">“流程”</span>窗格中,选择新的<span class="uicontrol">“Union”(合并)</span>步骤以查看结果。</p><p><b>在 Tableau Prep Builder 上:</b></p><p><img src="Img/prep_union_step.png" alt=""/></p><p><b>在 Tableau Server 或 Tableau Cloud 上:</b></p><p><img src="Img/Online_union.png" alt=""/><br/></p><p>您注意到,Tableau 自动匹配了具有相同名称和类型的字段。</p><p>您还看到,分配给流程中步骤的<b>颜色</b>用在并集配置中指明字段来自于何处,并同时出现在每个字段顶部的<b>色带</b>中,显示该字段是否存在于该表中。</p><p>您注意到新增了一个名为<span class="uicontrol">“Table Names”(表名称)</span>的新字段,该字段列出了并集中所有行的来源表。</p><p>不匹配字段的列表也显示在摘要窗格中,并且您可以立即看到字段<span class="uicontrol">“Product”(产品)</span>和<span class="uicontrol">“Discounts”(折扣)</span>只出现在 <span class="uicontrol">Orders_Central</span> 文件中。</p></li><li value="4"><p>若要更仔细地查看这些字段,请在“<b>并集结果</b>”窗格中选中<span class="uicontrol">“仅显示不匹配字段”</span>复选框。</p><p><img src="Img/prep_union_step_mismatch.png" alt=""/></p><p>通过查看字段数据,您很快发现数据相同,但字段名不同。您可以简单地重命名字段,但不知道是否能拖放这些字段来合并它们。您决定试一下看看。</p></li><li value="5"><p>选择<span class="uicontrol">“Product”(产品)</span>字段,并将其拖放到<span class="uicontrol">“Product Name”(产品名称)</span>字段上来合并字段。字段合并后将不再出现在窗格中。</p><p><img src="Img/prep_union_merge.png" alt=""/></p></li><li value="6"><p>重复此步骤,将<span class="uicontrol">“Discounts”(多项折扣)</span>字段与<span class="uicontrol">“Discount”(折扣)</span>字段合并。</p><p>现在,唯一没有匹配项的字段是<span class="uicontrol">“File Paths”(文件路径)</span>字段。在 Tableau Prep Builder 中,此字段显示您为“南部”区域销售订单执行的通配符并集的文件路径。您决定将此字段保留在该处,因为它有很好的信息。</p><p class="note--tip"><b>提示</b>:在合并之后修复不匹配的字段时,您有若干选择。如果 Tableau Prep 检测到可能的匹配项,它将以黄色突出显示相应匹配项。若要合并字段,请将光标悬停在突出显示的字段上,并单击出现的加号 <img src="Img/prep_addicon.png" alt=""/> 按钮。<br/><br/>有关在并集中合并字段的更多方式,请参见<a href="prep_combine.htm#Fix_union" class="MCXref xref">修复不匹配的字段</a>。</p></li><li value="7"><p>清除<span class="uicontrol">“仅显示不匹配字段”</span>复选框以显示并集中包括的所有字段。</p></li><li value="8"><p>为合并步骤命名以表示此并集所包括的内容。例如,“<b>All orders</b>”(所有订单)。</p></li></ol><h3 is="heading-item" :level="3" id="检查您的工作:观看“合并数据”的实际运行效果。">检查您的工作:观看“合并数据”的实际运行效果。</h3><p><i>单击图像可重播</i></p><p/><div alt="" src="Img/prep_get_started_union.gif" is="gif-player"/><p>您是清理天才!正当您对结果赞不绝口时,您的老板打来了电话。他忘了说他还想要您在分析中包括任何产品退货。他希望这项工作不会太麻烦。利用工具包中的 Tableau Prep,这完全不成问题!</p><h3 is="heading-item" :level="3" id="清理产品退货数据">清理产品退货数据</h3><p>您检查老板发给您的产品退货相关 Excel 文件,发现文件有一点杂乱。您将新文件 <b>return_reasons new</b> 添加到您的流程来仔细检查。</p><ol><li value="1"><p>在<span class="uicontrol">“连接”</span>窗格中,单击<span class="uicontrol">“添加连接”</span>。选择<span class="uicontrol">“Microsoft Excel”</span>并导航到您用于本练习的示例数据文件。(请参见<a href="#sample_files" class="MCXref xref">示例文件</a>以下载文件。)</p></li><li value="2"><p>选择 <b>return reasons_new.xlsx</b>,然后单击<span class="uicontrol">“打开”</span>将该文件添加到流程窗格。</p><p>此文件中只有 4 个您想要包括在流程中的字段:<span class="uicontrol">“Order ID”(订单 ID)</span>、 <span class="uicontrol">“Product ID”(产品 ID)</span>、 <span class="uicontrol">“Return Reason”(退货原因)</span>和<span class="uicontrol">“Notes”(注释)</span>。</p></li><li value="3"><p>在“<b>returns_new</b>”的<span class="uicontrol">“输入”</span>窗格中,清除最左边的列顶部的复选框以清除所有复选框。然后,选中<span class="uicontrol">“Order ID”(订单 ID)</span>、<span class="uicontrol">“Product ID”(产品 ID)</span>、<span class="uicontrol">“Return Reason”(退货原因)</span>和<span class="uicontrol">“Notes”(注释)</span>字段的复选框。</p><p><img src="Img/prep_return_file.png" alt=""/></p></li><li value="4"><p>重命名输入步骤以更好地反映此输入中包括的数据。在<span class="uicontrol">“流程”</span>窗格中,双击输入步骤名称<span class="uicontrol">“Returns_new”</span>,并键入<span class="uicontrol">“Returns (all)”(退货(全部))</span>。</p><p>通过查看示例字段值,您注意到<span class="uicontrol">“Notes”(注释)</span>字段似乎有很多不同的数据合并在一起。</p><p>您要在此文件中执行一些清理,然后才能对数据进行进一步处理,因此,您添加了清理步骤来进行检查。</p></li><li value="5"><p>在<span class="uicontrol">“流程”</span>窗格中,选择输入步骤“<b>Returns (all)</b>”(退货(全部)),单击加号 <img src="Img/prep_addicon.png" alt=""/> 图标或建议的清理步骤,添加一个清理步骤。</p><p>在“<b>配置</b>”窗格中,调整<span class="uicontrol">“Notes”(流程)</span>字段的大小以便更好地能看到各个条目。为此,请单击并将字段的右侧外缘向右拖。</p></li><li value="6"><p>在<span class="uicontrol">“Notes”(注释)</span>字段中,使用字段值右侧可视的滚动条来浏览各个值。</p><p>您注意到一些内容有问题:</p><ul><li><p>某些条目的内容中有额外的空格。这可能会导致字段被读取为 null 值。</p></li><li><p>审批者的名称似乎包括在退货注释条目中。为了更好地使用此数据,您需要将该信息放在一个单独的字段中。</p></li></ul><p>为了处理额外的空格,您记得有一个用于移除尾随空格的清理选项,因此决定尝试一下,看看该选项是否能修复问题。</p></li><li value="7"><p>选择<span class="uicontrol">“Notes”(注释)</span>字段。单击<span class="uicontrol">“更多选项”</span><img src="Img/prep_moreoptions_icon.png" alt=""/> 菜单(在以前的版本中为下拉箭头),并选择<span class="uicontrol">“清理”</span>><span class="uicontrol">“剪裁空格”</span>。</p><p><img src="Img/prep_trimspaces.png" alt=""/></p><p>太好了!它准确地完成了所需的操作。额外的空格不见了。</p><p>接下来,您想要为审批者名称创建一个单独的字段。您看到菜单中的<span class="uicontrol">“拆分值”</span>选项,因此决定尝试该选项。</p></li><li value="8"><p>选择<span class="uicontrol">“Notes”(注释)</span>字段。单击<span class="uicontrol">“更多选项”</span><img src="Img/prep_moreoptions_icon.png" alt=""/> 菜单(在以前的版本中为下拉箭头),并选择<span class="uicontrol">“拆分值”</span>><span class="uicontrol">“自动拆分”</span>。</p><p>此选项准确地完成了您希望其进行的操作。它自动将退货注释和审批者姓名拆分到单独的字段中。</p><p><img src="Img/prep_split1.png" alt=""/></p><p>就像 Tableau Desktop 一样,Tableau Prep 也为这些字段自动分配了名称。因此您将需要将新字段重命名为有意义的名称。</p></li><li value="9"><p>选择字段<span class="uicontrol">“Notes-Split 1”(注释-拆分 1)</span>。在字段名中双击,并键入<span class="uicontrol">“Return Notes”(退货注释)</span>。</p></li><li value="10"><p>为第二个字段重复此步骤,并将其重命名为<span class="uicontrol">“Approver”(审批者)</span>。</p></li><li value="11"><p>最后,在您不再需要原始<span class="uicontrol">“Notes”(注释)</span>字段时将其移除。选择<span class="uicontrol">“Notes”(注释)</span>字段,单击<span class="uicontrol">“更多选项”</span><img src="Img/prep_moreoptions_icon.png" alt=""/> 菜单(在以前的版本中为下拉箭头),并从菜单中选择<span class="uicontrol">“移除”</span>(在以前的版本中为<span class="uicontrol">“移除字段”</span>)。</p><p><img src="Img/prep_clean_returns.png" alt=""/></p><p>通过查看新的<span class="uicontrol">“Approver”(审批者)</span>字段,您注意到字段值列出了相同名称,但这些名称的输入方式不同。您想要将这些字段分组,以消除同一值的多个变体。</p><p>也许<span class="uicontrol">“对值进行分组”</span>(以前版本中的“分组和替换”)选项可帮助完成该操作?</p><p>您记得有一个用于<span class="uicontrol">“共同字符”</span>的选项。由于这些值共用相同字母,因此您决定试一下。</p></li><li value="12"><p>选择<span class="uicontrol">“Approver”(审批者)</span>字段。单击<span class="uicontrol">“更多选项”</span><img src="Img/prep_moreoptions_icon.png" alt=""/> 菜单(在以前的版本中为下拉箭头),并选择<span class="uicontrol">“对值进行分组”</span>(以前版本中的“分组和替换”)><span class="uicontrol">“共同字符”</span>。</p><p><img src="Img/prep_group_common.png" alt=""/></p><p>此选项为您将每个名称的所有变体分组在一起。这完全就是您想要达到的目的。</p><p>检查了其他名称来确保其正确分组后,您单击<span class="uicontrol">“完成”</span>关闭<span class="uicontrol">“对值进行分组”</span>编辑器。</p><p><img src="Img/prep_group_common1.png" alt=""/></p><p>此文件看起来非常好。</p></li><li value="13"><p>为清理步骤命名以跟踪您的工作。例如,“<b>Cleaned notes</b>”(清理的注释)。</p></li></ol><p>既然产品退货数据全部已清理,那么您想要将退货数据添加到合并的文件中的订单数据。但其中许多字段在合并的文件中不存在。若要将这些字段(数据列)添加到合并的数据集,您需要使用联接。</p><h3 is="heading-item" :level="3" id="联接数据">联接数据</h3><p>在联接数据时,这些文件至少必须有一个共同的字段。您的文件共用<span class="uicontrol">“Order ID”(订单 ID)</span>和<span class="uicontrol">“Product Id”(产品 Id)</span>字段,因此您可以在这些字段上联接,以查看共有这些字段的所有行。在您使用拖放创建并集时,您记得有一个用于创建联接的选项,因此您试了一下。</p><ol><li value="1"><p>在<span class="uicontrol">“流程”</span>窗格中,将<span class="uicontrol">“Cleaned notes”(清理的注释)</span>步骤拖到<span class="uicontrol">“All orders”(所有订单)</span>合并步骤上,并将其放在<span class="uicontrol">“联接”</span>上。</p><p><img src="Img/prep_join_return.png" alt=""/></p><p>在联接文件时,Tableau Prep 会在<span class="uicontrol">“联接配置”</span>中显示联接的结果。</p><p>处理联接可能会很棘手。您通常想要有一个具有联接中所包括因素的清晰视图,例如用于联接文件的字段、结果中的包括的行数,以及未包括或为 null 值的任何字段。</p><p>在 Tableau Prep 中查看联接的结果时,您很高兴地看到有如此多的信息,并且可以随时交互。</p><p><img src="Img/prep_join_details.png" alt=""/></p><p class="note--tip"><b>提示:</b>在联接配置最左侧的窗格中,您可以浏览联接并与之交互。您也可以在<span class="uicontrol">“联接子句”</span>窗格中直接编辑值,并在<span class="uicontrol">“联接结果”</span>窗格中执行清理操作。<br/><br/>在<span class="uicontrol">“联接类型”</span>图表中单击以尝试不同的联接配置,并在 <span class="uicontrol">“联接结果汇总”</span>部分中查看联接中为每个表包括或排除的行数。<br/><br/>在“已应用联接子句”部分中选择要进行联接的字段,或通过“联接子句建议”部分添加建议的联接子句。<br/><br/>有关使用联接的详细信息,请参见<a href="prep_combine.htm" target="_blank" class="MCXref xref">聚合、联接或合并数据<span class="sr-only">(链接在新窗口中打开)</span></a>。</p><p>您看到有超过 13,000 行被从“<b>All Orders</b>”(所有订单)文件中排除。创建联接之后,Tableau Prep 自动对<span class="uicontrol">“Product ID”(产品 ID)</span>字段进行了联接,但您还想对<span class="uicontrol">“Order ID”(订单 ID)</span>字段进行联接。</p><p>在浏览联接配置的左侧窗格时,您看到建议的联接子句列表中有<span class="uicontrol">“Order ID”(订单 Id)</span>,因此您从该处快速添加了该字段。</p></li><li value="2"><p>在<span class="uicontrol">联接</span>配置左侧窗格中的<span class="uicontrol">“联接子句建议”</span>部分,选择<span class="uicontrol">“Order ID = Order Id”</span>,并单击加号 <img src="Img/prep_addvalueicon.png" alt=""/> 按钮添加联接子句。</p><p><img src="Img/prep_join_rec.png" alt=""/></p><p>由于<span class="uicontrol">“联接类型”</span>设置为内部联接(Tableau Prep 的默认设置),因此联接仅包括两个文件中均存在的值。但您需要<span class="uicontrol">“Orders”(订单)</span>文件中的所有数据,以及这些文件的退货数据。因此您将需要更改联接类型。</p></li><li value="3"><p>在<span class="uicontrol">“联接类型”</span>部分,单击图表的一侧以包括所有订单。在下面的示例中,单击图表的左侧以将联接类型更改为<span class="uicontrol">“左”</span>联接,并包括<span class="uicontrol">“All orders”(所有订单)</span>合并步骤中的所有数据,以及<span class="uicontrol">“Cleaned notes”(清理的注释)</span>步骤中的任何匹配数据。</p><p><img src="Img/prep_join_rec2.png" alt=""/></p><p>现在,您有了销售订单文件中的所有数据,以及适用于这些订单的任何退货数据。您查看<span class="uicontrol">“联接子句”</span>窗格,并看到一些其他文件中不存在的不同值。</p><p>例如,有很多没有对应退货数据的订单行(显示为红色)。您能够浏览此详细级别的联接相关信息,这让您非常喜欢。</p><p>您急于想在 Tableau Desktop 中开始分析此数据,但在开始分析之前,您注意到联接要有一些结果需要清理。幸好您知道怎么做!</p><p class="note--tip"><b>提示</b>:不知道数据是否足够干净?从 Tableau Prep Builder 中,您可以从流程的任何步骤中通过 Tableau Desktop 预览数据,对其进行检查。<br/><br/>只需在<span class="uicontrol">“流程”</span>窗格中右键单击该步骤,并从菜单中选择<span class="uicontrol">“在 Tableau Desktop 中预览”</span>。<br/><br/>您可能会遇到您的数据和在 Tableau Desktop 中进行的更改未写回 Tableau Prep Builder 中的数据源的情况。有关详细信息,请参见<a href="prep_save_share.htm#View" target="_blank" class="MCXref xref">在 Tableau Desktop 中查看流程输出<span class="sr-only">(链接在新窗口中打开)</span></a>。</p></li><li value="4"><p>在开始清理联接结果之前,将<span class="uicontrol">联接</span>步骤命名为<span class="uicontrol">“Orders+Returns”(订单+退货)</span>,并保存流程。</p></li></ol><h3 is="heading-item" :level="3" id="清理联接结果">清理联接结果</h3><p class="note"><b>注意:</b>若要清理联接中的字段,您可以直接在“联接”步骤中执行清理操作。对于本教程,我们将添加一个清理步骤,以便您能够清晰地看到您的清理操作。如果要尝试直接在联接步骤中执行这些步骤,请跳过下面的步骤 1 和 3。</p><p>联接了两个步骤之后,系统为两个表都添加了“Order ID”(订单 ID)和“Product ID”(产品 ID)共同字段。</p><p>您想要保留所有订单中的“Product ID”(产品 ID)字段和退货文件中的“Order ID”(订单 ID)字段,并移除来自这些字段的重复字段。您也不需要输出文件中的<span class="uicontrol">“File Paths”(文件路径)</span>和<span class="uicontrol">“Table Names”(表名称)</span>字段,因此也需要移除这些字段。</p><p class="note--tip"><b>提示</b>:当您使用两个文件中均存在的字段联接表时,Tableau Prep 将会引入这些字段,并通过向字段名中添加“-1”或“-2”来重命名第二个文件中的重复字段。例如,“Order ID”(订单 ID)和“Order ID-1”(订单 ID-1)。</p><ol><li value="1"><p>在<span class="uicontrol">“流程”</span>窗格中,选择“<b>Orders+Returns</b>”(订单+退货),单击加号 <img src="Img/prep_addicon.png" alt=""/> 图标,并添加清理步骤。</p></li><li value="2"><p>在<span class="uicontrol">“配置”</span>窗格中,选择并移除以下字段:</p><ul><li><p><span class="uicontrol">Table Names(表名称)</span></p></li><li><p><span class="uicontrol">Order ID(订单 ID)</span></p></li><li><p><span class="uicontrol">文件路径</span>(仅限 Tableau Prep Builder)</p></li><li><p><span class="uicontrol">Product ID-1(产品 ID-1)</span></p></li></ul><p><img src="Img/prep_clean_orders_returns.png" alt=""/></p></li><li value="3"><p>将字段<span class="uicontrol">“Order ID-1”(订单 Id-1)</span>重命名为<span class="uicontrol">“Order ID”(订单 ID)</span>。</p><p>有很多产品已退货的 null 值,但没有指明退货注释或审批者。为了使此数据更易于分析,您想要添加一个值为<span class="uicontrol">“Yes”</span>和<span class="uicontrol">“No”</span>的字段来指明产品是否已退货。</p><p>您没有此字段,但可以通过创建计算字段来添加它。</p></li><li value="4"><p>在工具栏中,单击<span class="uicontrol">“创建计算字段”</span>。</p></li><li value="5"><p>将字段命名为<span class="uicontrol">“Returned?”(已退货?)</span>,然后输入以下计算并单击<span class="uicontrol">“保存”</span>。</p><p><code>If ISNULL([Return Reason])=FALSE THEN "Yes" ELSE "No" END</code></p><p><img src="Img/prep_calc_returned_bool.png" alt=""/></p><p>为了进行分析,您还想要知道订单发货天数,但您也没有该字段。</p><p>不过您有创建该字段所需的全部信息,因此添加了另一个计算字段来创建它。</p></li><li value="6"><p>在工具栏中,单击<span class="uicontrol">“创建计算字段”</span>。</p></li><li value="7"><p>将字段命名为<span class="uicontrol">“Days to Ship”(发货天数)</span>,然后输入以下计算并单击<span class="uicontrol">“保存”</span>。</p><p><code>DATEDIFF('day',[Order Date],[Ship Date])</code></p><p><img src="Img/prep_calc_days2ship.png" alt=""/></p></li><li value="8"><p>将步骤命名为<span class="uicontrol">“Clean Orders +Returns”(清理订单+退货)</span>。</p></li><li value="9"><p>保存您的流程。</p><p><img src="Img/prep_clean_orders_return2.png" alt=""/></p></li></ol><h2 is="heading-item" :level="2" id="5运行流程并生成输出"><a name="Run"/>5.运行流程并生成输出</h2><p>您的数据看起来很好,并且您已准备好生成输出文件以便开始在 Tableau Desktop 中对其进行分析。您只需运行流程并生成数据提取文件即可。为此,您需要添加一个<span class="uicontrol">输出</span>步骤。</p><p>根据工作位置,您可以将流程输出到文件(仅限 Tableau Prep Builder),输出到已发布数据源或数据库。</p><ol><li value="1"><p>在<span class="uicontrol">“流程”</span>窗格中,选择“<b>Clean Orders+Returns</b>”(清理订单+退货),单击加号 <img src="Img/prep_addicon.png" alt=""/> 图标,并选择<span class="uicontrol">“输出”</span>(以前版本中的<span class="uicontrol">“添加输出”</span>)。</p><p>添加输出步骤时,<span class="uicontrol">“输出”</span>窗格将打开,并显示数据的快照。在这里您可以选择要生成的输出的类型,并指定名称和要保存文件的位置。</p><p>默认位置为数据源文件夹中的<span class="uicontrol">“我的 Tableau Prep Builder”</span>存储库。</p><p><img src="Img/prep_tutorial_run.png" alt=""/></p></li><li value="2"><p>在左侧窗格的<span class="uicontrol">“将输出保存到”</span>下拉列表中,根据工作位置,执行以下操作之一: </p><p><b>Tableau Prep Builder</b></p><ol style="list-style-type: lower-alpha;"><li value="1">选择<span class="uicontrol">“文件”</span>(在以前的版本中选择<span class="uicontrol">“保存到文件”</span>)。</li><li value="2">单击<span class="uicontrol">“浏览”</span>按钮,然后在<span class="uicontrol">“将数据提取另存为”</span>对话框中输入文件的名称,例如<span class="uicontrol">“Orders_Returns_Superstore”</span>,并单击<span class="uicontrol">“接受”</span>。</li><li value="3"><p>在<span class="uicontrol">“输出类型”</span>字段中,选择一种输出类型。对于 Tableau Desktop,请选择 Tableau 数据提取 (.hyper),或者,如果要与第三方共享数据提取,请选择逗号分隔值 (.csv)。</p></li></ol><p><b>Tableau Server 或 Tableau Cloud</b></p><ol style="list-style-type: lower-alpha;"><li value="1">选择“<b>已发布数据源</b>”。</li><li value="2">选择一个项目。</li><li value="3"><p>输入文件的名称,例如<span class="uicontrol">“Orders_Returns_Superstore”</span>。</p></li></ol><p class="note--tip"><b>提示</b>:在通过流程生成输出时,您有一些选择。您可以生成数据提取文件(仅限 Tableau Prep Builder),可以将您的数据以数据源的形式发布到 Tableau Server 或 Tableau Cloud,或者可以将数据写入数据库。有关生成输出文件的详细信息,请参见<a href="prep_save_share.htm#Extract" target="_blank" class="MCXref xref">创建数据提取文件和已发布数据源<span class="sr-only">(链接在新窗口中打开)</span></a>。</p></li><li value="3"><p>在<span class="uicontrol">“写入选项”</span>部分,查看将新数据写入文件的选项。您希望使用默认选项(<span class="uicontrol">“创建表”</span>)并将表替换为流程输出,因而此处没有要更改的内容。</p><p class="note--tip"><b>提示</b>:从版本 2020.2.1 开始,您可以选择要如何将流程数据写回表。您可以从两个选项中进行选择;<span class="uicontrol">“创建表”</span>或<span class="uicontrol">“追加表”</span>。默认情况下,Tableau Prep 使用<span class="uicontrol">“创建表”</span>选项,并在运行流程时用新数据覆盖表数据。如果选择<span class="uicontrol">“追加表”</span>,Tableau Prep 会将流程数据添加到现有表,以便可以在每次流程运行时同时跟踪新数据和历史数据。有关详细信息,请参见<a href="prep_incremental_refresh.htm#flow-writeoptions" class="MCXref xref">配置写入选项</a>。</p></li><li value="4"><p>在“输出”窗格中单击<span class="uicontrol">“运行流程”</span>,或在流程窗格中单击<span class="uicontrol">“运行流程”</span><img src="Img/prep_run_flow.png" alt=""/> 按钮以生成输出。</p><p class="note"><b>注意</b>:如果在 Web 上工作,请单击“<b>发布</b>”以发布草稿流程。只能运行已发布的流程。</p></li><li value="5"><p>流程完成运行时,一个状态对话框将显示流程运行成功,以及运行所花费的时间。单击<span class="uicontrol">“完成”</span>关闭该对话框。</p><p><img src="Img/prep_run_flow_status.png" alt=""/></p><p>如果在 Web 上工作,请导航到<span class="uicontrol">“浏览”</span>><span class="uicontrol">“所有流程”</span>页面,并找到您的流程。您可以在“流程概述”页面上查看流程运行的状态。</p><p><img src="Img/prep_pwa_getstarted.png" alt=""/></p><p>若要使数据保持最新,您可以手动或使用命令行来运行流程。如果您有 <span class="mc-variable Variables.DM_sku variable">数据管理</span> 并启用了 Tableau Prep Conductor,还可以在 <span class="mc-variable Variables.TabsProductServer variable">Tableau Server</span> 或 <span class="mc-variable Variables.TabsProductOnline variable">Tableau Cloud</span> 中按计划运行流程。</p><p>从 Tableau Prep Builder 版本 2020.2.1 开始以及在 Web 上,您还可以选择在每次运行流程时刷新所有数据,或使用增量刷新运行流程,并且每次只处理新数据。</p><p>有关使数据保持最新的详细信息,请参见以下主题:</p><ul><li><a href="prep_run_commandline.htm" target="_blank" class="MCXref xref">通过命令行刷新流程输出文件<span class="sr-only">(链接在新窗口中打开)</span></a></li><li><a href="prep_conductor_publish_flow.htm" target="_blank" class="MCXref xref">将流程发布到 Tableau Server 或 Tableau Cloud<span class="sr-only">(链接在新窗口中打开)</span></a></li><li><a href="prep_incremental_refresh.htm" target="_blank" class="MCXref xref">使用增量刷新来刷新流程数据<span class="sr-only">(链接在新窗口中打开)</span></a></li></ul></li></ol><h2 is="heading-item" :level="2" id="总结和资源"><a name="Wrap"/>总结和资源</h2><p>您是数据准备巨星了!您轻松地找出了不良数据并对其进行了改变!您很快清理并准备好了来自多个数据集的数据,并将其转换为可立即在 Tableau Desktop 中处理来进行分析的井然有序、干净的数据集。</p><p>想要进行更多练习?尝试使用下列文件夹中的数据文件重复执行 Superstore 示例流程的其余步骤:</p><ul><li><a href="https://mkt.tableau.com/PrepTutorials/orders_south_2015.csv">Orders_South_2015</a></li><li><a href="https://mkt.tableau.com/PrepTutorials/orders_south_2016.csv">Orders_South_2016</a></li><li><a href="https://mkt.tableau.com/PrepTutorials/orders_south_2017.csv">Orders_South_2017</a></li><li><a href="https://mkt.tableau.com/PrepTutorials/orders_south_2018.csv">Orders_South_2018</a></li><li><a href="https://mkt.tableau.com/PrepTutorials/Orders_Central.csv">Orders_Central</a></li><li><a href="https://mkt.tableau.com/PrepTutorials/Orders_East.xlsx">Orders_East</a></li><li><a href="https://mkt.tableau.com/PrepTutorials/Orders_West.csv">Orders_West</a></li><li><a href="https://mkt.tableau.com/PrepTutorials/return_reasons_new.xlsx">returns_reasons_new</a></li><li><a href="https://mkt.tableau.com/PrepTutorials/Quota.xlsx">Quota</a></li></ul><p>在安装 Tableau Prep Builder 后,您还可以在计算机上的以下位置找到这些文件:<br/></p><ul><li>(Windows) <code>C:\Program Files\Tableau\Tableau Prep Builder <version>\help\Samples\en_US\Superstore Files</code></li><li>(Mac) <code>/Applications/Tableau Prep Builder <version>.app/Contents/help/Samples/en_US/Superstore Files</code></li></ul><p>想要获得更多培训?查看这些优质<a href="https://www.tableau.com/zh-cn/about/blog/2018/7/master-tableau-prep-list-learning-resources-92064" target="_blank">资源<span class="sr-only">(链接在新窗口中打开)</span></a>,或参加<a href="https://www.tableau.com/zh-cn/learn/classroom/prep" target="_blank">现场培训<span class="sr-only">(链接在新窗口中打开)</span></a>课程。</p><p>想要了解我们所讨论主题的详细信息?请查看 Tableau Prep 联机帮助中的其他主题。</p></div><div id="tableau-help-other-articles-in-section"><h2 is="heading-item" :level="2" id="此部分中的其他文章">此部分中的其他文章</h2><div is="menu-tree-static" :levels-to-show="1"/></div></div><div class="article__footer--back-to-top text--centered print-hidden quick-help-hidden"><a href="#" class="text--caps" onclick="setFocus()"><span class="icon--med icon--arrow-up"/> 回到顶部</a></div><feedback-form :disabled="false" class="print-hidden content-only-hidden" helpful-question="这篇文章解决了您的问题吗?" helpful-yes="是" helpful-no="否" comment-question="我们重视您的反馈。在此处添加注释。" submit-option="发送" cancel-option="取消" loading-text="正在发送..."><span slot="submittedMessage">感谢您的反馈!</span></feedback-form><d-s-c-feedback-form :disabled="false" class="print-hidden content-only-hidden quick-help-hidden" feedback-question="这篇文章解决了您的问题吗?" feedback-subtitle="让我们知道,这样我们才能改进!" helpful-yes="是" helpful-no="否" error-message="请至少选中 1 个复选框。" thanks-positive-feedback="感谢您的反馈!这篇文章对您有什么帮助?" thanks-negative-feedback="很遗憾听到这一点。我们如何改进这篇文章?" feedback-yes-accurate="包含准确的信息" feedback-yes-comprehensive="包括我需要的所有信息" feedback-yes-clear="易于理解,具有清晰的解释和视觉效果" feedback-no-accurate="包含不准确或过时的信息" feedback-no-comprehensive="缺少重要信息" feedback-no-clear="令人困惑或者难以理解" feedback-no-descriptive="这篇文章不错,但我不喜欢所描述的产品的工作方式" feedback-something-else=" 其他" additional-feedback="您是否愿意分享任何其他反馈?" submit-answers="提交"><span slot="successfullySubmitted">您的反馈已成功提交。谢谢!</span></d-s-c-feedback-form></article><nav class="nav-side nav-side--right"><menu-heading-links-scrollable-help menu-title="本文内容" :disabled="false" :headings="pageHeadings"/></nav></div></div><feedback-button-floating tooltip="发送反馈" :disabled="false"/><footer class="container--full-width"><div class="container--centered"><div class="footer__links text--caps"><ul><li><a href="https://www.tableau.com/zh-cn/legal" class="">法律</a></li><li><a id="privacyLink" class="">隐私</a></li><li><a href="#" data-ignore-geolocation="true" class="optanon-toggle-display">Cookie 首选项</a></li></ul></div><div class="footer__copyright text--caps"><copyright-notice year-start="2003" notice-text="Salesforce, Inc."/></div></div></footer></div> </body>
推荐文章