首先读入2张表
这两张表的证券代码和日期字段不一致,先整成一样的。
最后根据给出的故公式定义下熵函数。将2张表连接起来之后再使用apply调用熵函数计算。
第二题没整出来 随后再慢慢想吧
-
有多少县满足总投票数超过县人口数的一半。
我的思路是这样的:
(1)读入president_county_candidate表。读入country_population表。发现2张表的县的名称表述不一致。我们需将其转化为一致的。
(2) 建立字典,键为县名,值为人口数。
(3)从投票表中取出州名和投票数字段,建立字典。遍历字典,若投票数大于人口数的1/2,结果加一,得到有1040个县满足总投票数超过县人口数的一半。
-
把州(state)作为行索引,把投票候选人作为列名,列名的顺序按照候选人在全美的总票数由高到低排序,行列对应的元素为该候选人在该州获得的总票数。
首先 , 长表变宽表,然后按题目要求排个序。
- 每一个州下设若干县,定义拜登在该县的得票率减去川普在该县的得票率为该县的BT指标,若某个州所有县BT指标的中位数大于0,则称该州为Biden State,请找出所有的Biden State。
这道题也不会写