非常简单,这些scipy的方法能够非常鲁棒地直接应用于dataframe的列中,只要你索引好了就行了吼。
示例代码如下:
from scipy.stats import ttest_ind
cat1 = my_data[my_data['Category']=='cat1']
cat2 = my_data[my_data['Category']=='cat2']
ttest_ind(cat1['values'], cat2['values'])
>>> (1.4927289925706944, 0.16970867501294376)
非常方便哈,如果我只有一组数据,并且要和x(x是一个值)比较的话,直接ttest_1samp(dataframe['column'], x)就行啦。