我有一个数据框架,如下所示。
ticker fy fp value f_date rn
MSFT 2009 0 144 2010-01-01T12:12:34 0
AAPL 2010 0 144 2010-01-01T12:12:34 0
MSFT 2009 0 48 2014-05-01T12:12:34 1
AAPL 2011 0 80 2012-01-01T12:12:34 1
GOOG 2010 0 40 2010-01-01T12:12:34 0
我只想在ticker
、fy
、fp
的基础上对这些数据进行分组,如下所示
df.groupby(by=['ticker', 'fy', 'fp'])
在此基础上,我只想计算f_date
中的max
和min
的差值,并将其除以max of rn
。例如,组MSFT, 2009, 0
,最大日期是2014-05-01T12:12:34
,最小日期是2010-01-01T12:12:34
,而最大rn
是1,所以我想把它计算成max(f_date) - min(f_date)/ max(rn+1)
。因此,我将得到这两个日期之间的天数,因此我可以将这些数据与其他数据进行映射,以做一些分析。
我在组别后无法继续前进。