在這個教學中,你將學習如何在 Azure Synapse Analytics 中用
Foundry 工具
豐富你的資料。 你會使用
Foundry Tools 中的 Azure 語言
文本分析功能來進行情感分析。
Azure Synapse 中的使用者可以選取包含文字欄位的資料表,以進行情感分析。 這些情緒可以是正面、負面、混合或中性。 也會返回一個概率。
此教學課程涵蓋:
取得 Spark 資料表資料集的步驟,此資料集包含用於情感分析的文字資料行。
使用 Azure Synapse 中的精靈體驗,透過 Text Analytics in Language 來豐富資料。
如果您沒有 Azure 訂用帳戶,請在開始前建立
免費帳戶
。
Azure Synapse Analytics 工作區
,其中 Azure Data Lake Storage Gen2 儲存體帳戶已設定為預設儲存體。 使用 Data Lake Storage Gen2 檔案系統時,您必須是該檔案系統的
儲存體 Blob 資料參與者
。
在您的 Azure Synapse Analytics 工作區中的 Spark 集區。 如需詳細資訊,請參閱
在 Azure Synapse 中建立 Spark 集區
。
在教學中描述的預先設定步驟:
在 Azure Synapse 中配置 Foundry 工具
。
登入 Azure 入口網站
登入
Azure 入口網站
。
建立 Spark 資料表
對於本教學課程,您將需要 Spark 資料表。
下載
FabrikamComments.csv
檔案,其中包含用於文字分析的資料集。
在 Synapse 分析中,於 [資料] 和 [連結] 底下開啟您的儲存體帳戶。
將檔案上傳至 Data Lake Storage Gen2 中的 Azure Synapse 儲存體帳戶。
%%pyspark
df = spark.read.load('abfss://default@azuresynapsesa.dfs.core.windows.net/data/FabrikamComments.csv', format='csv'
## If a header exists, uncomment the line below
, header=True
df.write.mode("overwrite").saveAsTable("default.YourTableName")
Azure Cognitive Services 連結服務:作為前置步驟的一部分,你已建立了一個與 Foundry Tool 的連結服務。 請在這裡選取此服務。
語言
:選取 [英文]
作為您想要在其上執行情感分析的文字語言。
文字欄位
:選取
註解 (字串)
作為您資料集中要分析以判斷情緒的文字欄位。
完成時,請選取 [開啟筆記本]
。 這會生成一本筆記本,裡面有 PySpark 程式碼,並用 Foundry 工具進行情感分析。
執行該筆記本
你剛打開的筆記本是用
SynapseML 函式庫
來連接 Foundry 工具。 你提供的 Foundry Tools 連結服務,讓你能安全地參考這個經驗中的 Foundry 工具,且不會洩露任何秘密。
您現在可以執行所有單元格,以增強資料的情緒性。 選擇
全部執行
。
情緒會以 [正面]
、[負面]
、[中性]
或 [混合]
的方式傳回。 您也會取得每個情感的機率值。
了解更多關於 Foundry Tools 中的情感分析
。