在這個教學中,你將學習如何在 Azure Synapse Analytics 中用 Foundry 工具 豐富你的資料。 你會使用 Foundry Tools 中的 Azure 語言 文本分析功能來進行情感分析。

Azure Synapse 中的使用者可以選取包含文字欄位的資料表,以進行情感分析。 這些情緒可以是正面、負面、混合或中性。 也會返回一個概率。

此教學課程涵蓋:

  • 取得 Spark 資料表資料集的步驟,此資料集包含用於情感分析的文字資料行。
  • 使用 Azure Synapse 中的精靈體驗,透過 Text Analytics in Language 來豐富資料。
  • 如果您沒有 Azure 訂用帳戶,請在開始前建立 免費帳戶

    Azure Synapse Analytics 工作區 ,其中 Azure Data Lake Storage Gen2 儲存體帳戶已設定為預設儲存體。 使用 Data Lake Storage Gen2 檔案系統時,您必須是該檔案系統的 儲存體 Blob 資料參與者
  • 在您的 Azure Synapse Analytics 工作區中的 Spark 集區。 如需詳細資訊,請參閱 在 Azure Synapse 中建立 Spark 集區
  • 在教學中描述的預先設定步驟: 在 Azure Synapse 中配置 Foundry 工具
  • 登入 Azure 入口網站

    登入 Azure 入口網站

    建立 Spark 資料表

    對於本教學課程,您將需要 Spark 資料表。

  • 下載 FabrikamComments.csv 檔案,其中包含用於文字分析的資料集。

  • 在 Synapse 分析中,於 [資料] 和 [連結] 底下開啟您的儲存體帳戶。

  • 將檔案上傳至 Data Lake Storage Gen2 中的 Azure Synapse 儲存體帳戶。

    %%pyspark
    df = spark.read.load('abfss://default@azuresynapsesa.dfs.core.windows.net/data/FabrikamComments.csv', format='csv'
    ## If a header exists, uncomment the line below
    , header=True
    df.write.mode("overwrite").saveAsTable("default.YourTableName")
                  Azure Cognitive Services 連結服務:作為前置步驟的一部分,你已建立了一個與 Foundry Tool 的連結服務。 請在這裡選取此服務。
  • 語言 :選取 [英文] 作為您想要在其上執行情感分析的文字語言。 文字欄位 :選取 註解 (字串) 作為您資料集中要分析以判斷情緒的文字欄位。

    完成時,請選取 [開啟筆記本] 。 這會生成一本筆記本,裡面有 PySpark 程式碼,並用 Foundry 工具進行情感分析。

    執行該筆記本

    你剛打開的筆記本是用 SynapseML 函式庫 來連接 Foundry 工具。 你提供的 Foundry Tools 連結服務,讓你能安全地參考這個經驗中的 Foundry 工具,且不會洩露任何秘密。

    您現在可以執行所有單元格,以增強資料的情緒性。 選擇 全部執行

    情緒會以 [正面] 、[負面] 、[中性] 或 [混合] 的方式傳回。 您也會取得每個情感的機率值。 了解更多關於 Foundry Tools 中的情感分析