240 发简信
IP属地:浙江
  • Amundsen清除过期的元数据

    删除neo4j的数据rm -rf /var/lib/docker/volumes/amundsen_neo4j_data/_data/datab...

  • Python读写Excel和PDF表格

    python读写Excel有xlwt和xlrd库,但是:xlwt只能写新的单元格,不能更新已写过的单元格;xlrd只能读已有内容的单元格,未写内...

  • springboot异步请求

    1.异步请求, 在异步类或方法上加@Async 注意:@Async注解的方法的返回类只能是void和Future ,Future可以封装返回...

  • Python 爬虫

    想要统计一下中国药品临床试验机构的信息,尝试从国家官网上爬一下机构信息。主要是get http请求得到html,再解析html。 一个坑 请求需...

  • 【转】word2vector的前世今生

    [https://www.cnblogs.com/iloveai/p/word2vec.html] 2013年,Google开源了一款用于词向量...

  • SimHash

    1.采用Hanlp分词,再计算SimHash值,及Hamming距离。2.SimHash适用于较长文本(大于三五百字)的相似性比较,文本越短,以...

  • kettle遇到的坑

    连接哪个数据库用哪个数据库的sql语句 一个transformation里设置的参数在该transformation中不可用 参数引用格式为${...

  • AI药物研发

    节选自百度AI2018发布的《以人为本,人工智能助力医疗体系科学发展》白皮书 新药研发成本极高、周期极长。业界一直流传着“双10”的说法,即新药...

个人介绍
西交本科 浙大博士 机械背景程序员