240 发简信
IP属地:上海
  • 120
    pandas中读取csv文件的一些小技巧

    前言: pandas中读取csv文件通常使用pd.read_csv()函数,正常情况下给出文件路径即可读取数据,不过在某些特殊情况下,需要一些小技巧才能读取正确的内容 文本型...

  • 将字符串日期转换成datetime

    前言 在证券交割单中,日期格式为字符串,如20180101。如果需要将其以时间序列形式写入pandas中的dataframe,就需要将文本格式化。 操作方法也很简单,使用to...

  • 120
    pandas中数据偏移计算

    前言 在金融计算中,有很多内容都涉及偏移计算,例如计算5天平均移动线、计算10天涨幅等等,pandas中有很多函数可以非常简单的用一行代码予以解决 rolling函数 主要解...

  • 120
    snapshot中进行统计学分析

    引言 AGS中可以导出每次飞行的快照数据,这些数据对于飞行品质的分析非常有帮助。目前上航每月737航班约产生9000-10000行快照信息,每行信息包含200个字段 分析字段...

  • git使用指南

    最近在研究如何使用git,虽然都是命令行比较复杂,但总结下常用的命令,对开发者而言会省力很多。 下面就从一天典型的工作流程开始,介绍git的命令行,前后有一定的逻辑顺序,方便...

  • 120
    tushare历史数据读取开销比较

    本方法测试使用get_k_data更新某一单项历史数据(比如60分钟线),计算耗时。 测试用服务器使用amazon web service+cloud9云编程平台,使用两种不...

  • tushare中的get_k_data的去重问题

    由于获取数据的时限性,在日线以下的数据,比如小时线只能获取一定时间范围,超过该时间就无法再获取了。根据实测,60分钟线大约能保存6个月的数据,5分钟线约保存15天数据,因此在...

  • 获取最新股票代码列表

    在tushare中,任何数据处理的前提都是获取最新的股票代码列表,有两种方式可以获得: 方法一 使用ts.get_today_all()返回结果如下: 改方法的缺点是获取数据...

  • 将两个不同日期的同一股票数据合并

    由于数据更新的需要,往往需要将新日期获取的数据合并到原有的数据中,pandas中的concat函数能很好的完成合并工作,再通过使用drop_duplicates方法去除重复的...

  • 关于urllib从python2向pyhon3迁移的问题

    背景 最近在调用聚合数据的短信API接口,原有的代码是python2,目前我所使用的python全部都在3上(因为mysql接口已经迁移到3),所以稍微爬了一下代码,做了迁移...

  • 2018-04-03

    今天进行了AGS的姓名匹配工作,由于系统默认在发动机关车后进行数据上传,因此实际观察下来后可以按照QAR系统接收时间和航班实际关车时间做对比进行匹配,一般间隔时间均为几分钟内...

  • MYSQL中的多事务处理

    背景 在某个应用场景中,需要对一个航班的机组3人进行航线拆分,原数据库字段内容为:姓名A,姓名B,姓名C,拆分后的结果是导入到[crew_link],成为3行不同的数据。 按...

  • 2018-02-06

    今天遇到一个错误代码:'ascii' codec can't decode byte 0xe4 in position 0: ordinal not in range(128...

  • Tushare安装教程

    安装tushare 1.下载最新版软件python3支持 (版本号查询地址https://docs.anaconda.com/anaconda/install/linux):...

  • MYSQL操作

    Linux 下命令操作 启动:service mysqld start停止:service mysqld stop重启:service mysqld restart查看状态:...

  • 用datetime计算时间差

    最近在计算两个时间字符串的差值,会用到datetime模块在这个模块中,提供计算天数、秒和总秒数的差值计算。 计算天数间隔 输出结果1 计算秒数间隔 输出结果:3706 等等...

  • datetime函数故障处理

    今天出现了一个很奇怪的bug,在导入datetime函数时出现了 the bad magic number error,怀疑和python2/3的版本混装有关,另外我在保存p...

  • 2018-01-29

    最近朋友推荐了一个基金 [景顺长城量化新动力股票 (001974)],我一般对于基金的态度都不太好,因为高申购费率和管理费率会严重侵蚀你的收益率,所以买入基金的理由是看好股市...