240 投稿
收录了98篇文章 · 159人关注
  • 文本相似性的总结

    文本相似性的应用场景会有很多,在工业界我粗略遇到过: 热点做舆情识别监控的时候,需要对全网文章进行聚合,聚合过程中需要知道哪些文章是一致的 推荐...

  • Resize,w 360,h 240
    Jieba分词原理与解析

    1 HMM模型 马尔科夫过程: 以天气判断为例:引出隐马尔科夫模型image.pngimage.png 以天气判断为例:由海藻信息推测天气 于是...

    1.1 林桉 0 4
  • 快速上手关键词抽取的算法

    前言 在自然语言处理领域,我们有一种类型的问题是如何在一堆文本中提取出核心词/句子。而无论是对于长文本还是短文本,往往几个关键词就可以代表整个文...

  • Bert需要理解的一些内容

    更多来自于GitHub:Reflection_Summary. Bert的双向体现在什么地方? mask+attention,mask的word...

  • Auto Machine Learning初探

    前言 最近在看AutoML,业界在 automl 上的进展还是很不错的,个人比较看好这个方向,所以做了一些了解: Google: Cloud A...

  • 集成学习需要理解的一些内容

    本系列为深入篇,尽可能完善专题知识,并不会所有的都会出现在面试中,更多内容,详见:Reflection_Summary,欢迎交流。 另外,欢迎大...

  • LR需要理解的一些内容

    本系列为深入篇,尽可能完善专题知识,并不会所有的都会出现在面试中,更多内容,详见:Reflection_Summary,欢迎交流。 另外,欢迎大...

  • Resize,w 360,h 240
    机器学习基础(16)- 主题模型LDA理解与应用

    本文主要用于理解主题模型LDA(Latent Dirichlet Allocation)其背后的数学原理及其推导过程。本菇力求用简单的推理来论证...

  • Python自用工具包PyTls

    我们搞了个python的工具包PyTls。 做这件事的初衷是发生了一个星期要用python同时开发3个项目的情况,我发现了两个现象:1.有很多定...

  • Resize,w 360,h 240
    多个github帐号更新多个hexo博客

    一台电脑, 多个github帐号的SSH key切换, 更新多个hexo博客 github账号,工作有一个,自己有一个。但是默认下使用ssh k...

专题公告

机器学习、数据挖掘、深度学习、数据分析相关技术文章