pandas非常简便的t-test以及其他test

帮助文档在这里

非常简单,这些scipy的方法能够非常鲁棒地直接应用于dataframe的列中,只要你索引好了就行了吼。

示例代码如下:

from scipy.stats import ttest_ind

cat1 = my_data[my_data['Category']=='cat1']

cat2 = my_data[my_data['Category']=='cat2']

ttest_ind(cat1['values'], cat2['values'])

>>> (1.4927289925706944, 0.16970867501294376)

非常方便哈,如果我只有一组数据,并且要和x(x是一个值)比较的话,直接ttest_1samp(dataframe['column'], x)就行啦。

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容