f47a802b35d4 - 简书

发简信

13
关注
1
粉丝
0
文章
0

字数
0

收获喜欢
1

总资产

IP属地：北京

f47a802b35d4

【转】RStudio+Markdown+Pandoc的中文配置
原文地址之前的博客有写到过Markdown轻量级标记语言，也提到过RStudio，还有神奇的Pandoc。今天就介绍一下用RStudio来搭配Markdown的写作环境，并利...

赵禾禾
6818 0 14
f47a802b35d4

零基础学Python
iLester 编，60 篇文章，10 人关注

f47a802b35d4

iLester
写了 136398 字，被 186 人关注，获得了 560 个喜欢

教师、撰稿人、培训师。
f47a802b35d4

Praat 语音标注
Praat 语音学软件，原名Praat: doing phonetics by computer，通常简称 Praat，是一款跨平台的多功能语音学专业软件，主要用于对数字化的...

MayJin
17152 4 8
f47a802b35d4

Python大数据：jieba分词，词频统计
实验目的学习如何读取一个文件学习如何使用DataFrame 学习jieba中文分词组件及停用词处理原理了解Jupyter Notebook 概念中文分词在自然语言处...

_黑冰_
67119 18 66 2
f47a802b35d4

python 词云模块：wordcloud
参考：生成词云之python中WordCloud包的用法https://amueller.github.io/word_cloud/https://github.com/am...

领悟悟悟
9751 0 7
f47a802b35d4

中文分词原理及常用Python中文分词库介绍
转自进击的Coder 公众号原理中文分词，即 Chinese Word Segmentation，即将一个汉字序列进行切分，得到一个个单独的词。表面上看，分词其实就是那...

Epiphron
11535 2 56

f47a802b35d4

ICTCLAS中文分词器（现在叫nlpir）
ICTCLAS（现在叫nlpir）是中科院张华平博士开发中文分词器。NLPIR分词系统前身为2000年发布的ICTCLAS词法分析系统，从2009年开始，为了和以前工作进行大...

sennchi
5957 0 1
f47a802b35d4

机器学习笔记-文本分类（四）代码实现
在学习文本分类的时候发现主要有以下几个步骤，借助代码说明（代码大多参考：机器学习算法原理与编程实战，不过发现给的语料有些编码问题，并且本人用的是Python3.6+windo...

sf705
10781 6 12
f47a802b35d4

机器学习笔记-文本分类（三）TF-IDF
TF-IDF简介 TF（Term Frequency）是指词频，就是一个词在文本中出现的词数，常用标准化处理 IDF（Inverse Document Frequency）是...

sf705
5152 2 4
f47a802b35d4

机器学习笔记-文本分类（一）概述
最近在看机器学习的书籍和视频，主要有：统计学习方法李航西瓜书周志华python机器学习实战机器学习算法原理与编程实战郑捷（本文主要参看这本书，有代码，不过做本文做了稍...

sf705
3049 2 6
f47a802b35d4

python中使用OCR 技术进行《文字识别》
安装tesseract-ocr-setup-3.02.02 并配置环境变量链接：https://pan.baidu.com/s/1c3vIslq 密码：px5g 打开CMD...

OldKe
1772 0 1

f47a802b35d4

Python+Tesseract实现图片文字识别
导语图片文字识别也是有点意思哈，苦于现在用Python实现图片中文识别的方法很有限，不知死活的胖子打算记录一下自己挥泪的实现过程…… 1. 工具准备笔者使用的是Tesse...

一个不知死活的胖子
19634 3 15
f47a802b35d4

使用Tesseract+python进行图片转文字记录
先把Tesseract的基础部分放上来。由于对游戏的文案非常感兴趣，所以希望可以将游戏中图片截图，识别图片上的文字转成txt，基于此记录一下学习过程，简单记录。环境说明： ...

进击的程序茗
8556 0 6
f47a802b35d4

Python--文字识别--Tesseract
1.介绍 Tesseract 是一个 OCR 库,目前由 Google 赞助(Google 也是一家以 OCR 和机器学习技术闻名于世的公司)。Tesseract 是目前公认...

ztfdeveloper
1476 0 6
f47a802b35d4

python进阶：字符串和文本处理
字符串是一种重要的数据形式，有价值的程序都会涉及到对于字符串的处理。幸运的是，强大的python内置了很多函数，来帮助我们解析和处理字符串。本文会涉及到字符串编码，简单的字符...

天涯待归客
4915 0 2
f47a802b35d4

Python文本处理笔记
读取数据过滤非ASC字符过滤数字去停用词从HTML中提取纯文本

CrossCode
345 0 1

f47a802b35d4

Python教程0-3:第三方编辑器推荐
聊聊优秀编辑器的特点 Python官方安装包提供的两种代码编辑工具对于调试与运行Python程序虽然已经够用，但为了提升代码编写的效率以及体验，我还是强烈建议大家使用一些第三...

iLester
1008 0 7
f47a802b35d4

数据清洗经验
平时习惯了在某些特定的数据集合上做实验，简单的tokenization、预处理等步骤就足够了。但是在数据越来越大的年代，数据清洗越来越重要，也越来越复杂。看到Philip J...

三万_chenbing
1060 1 4

暂无个人介绍