统计
函数
用于创建聚合,对数据进行统计分析。在使用统计
函数
时,必须考虑到数据模型,表之间关系,数据重复等因素,一般都会搭配过滤
函数
实现数据的提取和分析。
统计量一般是:均值、求和、
计数
、最大值、最小值、求中位数、求分位数、方差和标准差等。
一,求均值
均值分为几何均值和算术均值,几何平均数是n个变量值连乘积的n次方根:
常用下面两个
函数
计算列值的算术平均值,AVERAGE
函数
用于对表中的数值型的...
涉及排名或做排行榜的时候,我们需要和No.1的值做比较,来查看差距。比如业务员比较销售业绩的时候,将其他业务员的业绩与销售冠军进行比较;在市场占有率上,挑战者与主导者的市场份额比较;学分排名上,其他学员的成绩和第一名的成绩进行比较等等,需要确定TOP1的值,接下来用多种方式计算TOP1的值。
场景是房产销售业绩排行比较。销售表记录了销售员销售多种户型的销售额记录,新建一个销售员表与销售表的销售员...
#### Pandas中的
计数
函数
在Pandas库中,`count()` 是一种非常常见的
计数
函数
,它可以用来统计DataFrame或Series中非缺失值的数量。此
函数
可以应用于整个数据框或者特定的一列或多列[^2]。
```python
import pandas as pd
data = {'Name': ['Alice', 'Bob', None, 'David'],
'Age': [25, 30, 22, None]}
df = pd.DataFrame(data)
# 统计每列的非空值数量
non_null_counts = df.count()
print(non_null_counts)
上述代码会返回如下结果:
Name 3
Age 3
dtype: int64
这表明 `Name` 列中有三个非空值,而 `Age` 列同样有三个非空值。
####
Power
BI
DAX
中的
计数
函数
在
Power
BI
的数据分析表达式 (
DAX
) 中,提供了多种
计数
函数
来满足不同的需求。以下是几个常用的
计数
函数
及其说明:
1. **COUNT**: 仅对包含数字的单元格进行
计数
。
2. **COUNTA**: 对任何类型的非空白单元格(包括文本、逻辑值等)进行
计数
。
3. **COUNTBLANK**: 对空白单元格进行
计数
。
4. **COUNTROWS**: 返回表中行的数量。
5. **DISTINCTCOUNT**: 对某一列中的唯一值进行
计数
[^3]。
下面是一个具体的例子展示如何使用这些
函数
之一 —— COUNTROWS:
假设有一个名为 `SalesTable` 的表格,则可以通过以下方式获取其行数:
```
dax
RowCount_SalesTable = COUNTROWS(SalesTable)
如果要计算某列(比如产品类别 ProductCategory)的不同种类数目,可采用 DISTINCTCOUNT
函数
:
```
dax
DistinctProductCategories = DISTINCTCOUNT(SalesTable[ProductCategory])
以上展示了两种不同工具下实现
计数
功能的方法,并附带了相应的实例供参考。