240 发简信
IP属地:北京
  • 120
    算法长征

    noob一个从剑指开始! Day 1 搜索二维矩阵 II[https://leetcode-cn.com/problems/search-a-2d-matrix-ii/] 编...

  • 120
    SQL长征

    新开一个帖子记录SQL的漫漫长征~ Day 1 leecode SQL 175 表1: Person +-------------+---------+| 列名 ...

  • 120
    数据分析 论文作者信息关联

    任务:作者信息关联 [https://github.com/datawhalechina/team-learning-data-mining/blob/master/Acad...

  • 120
    异常检测——高维数据异常检测

    异常检测——高维数据异常检测 主要内容包括: Feature Bagging 孤立森林 [TOC] [https://github.com/datawhalechina/te...

  • 文本处理 论文种类分类

    1 任务说明 学习主题:论文分类(数据建模任务),利用已有数据建模,对新论文进行类别分类; 学习内容:使用论文标题完成类别分类; 学习成果:学会文本分类的基本方法、TF-ID...

  • 120
    异常检测 基于相似度的方法

    1、概述 “异常”通常是一个主观的判断,什么样的数据被认为是“异常”的,需要结合业务背景和环境来具体分析确定。   实际上,数据通常嵌入在大量的噪声中,而我们所说的“异常值”...

  • 论文预处理 - 正则表达式

    正则表达式 正则表达式(regular expression)描述了一种字符串匹配的模式(pattern),可以用来检查一个串是否含有某种子串、将匹配的子串替换或者从某个串中...

  • 异常检测 线性相关办法

    1. 前言 真实数据集中不同维度的数据通常具有高度的相关性,这是因为不同的属性往往是由相同的基础过程以密切相关的方式产生的。在古典统计学中,这被称为——回归建模,一种参数化的...

  • 数据分析 预处理与简单的统计

    Kin Lim Lee 分析了8个简单的预处理代码,一共涵盖8个场景,分别是: 删除多列、更改数据类型、将分类变量转换为数字变量、检查缺失数据、删除列中的字符串、删除列中的空...

  • 异常检测(2)

    基于统计学的异常检测 主要内容包括: - 高斯分布 可以通过 3** 来检测,样本为正态分布或者近似正态分布的数据。原则上:数值分布在(μ-σ,μ+σ)中的概率为0.6827...

  • 数据分析(一些基本概念)

    首先,在开篇想谈一些自己对于数据分析以及数据挖掘的认识,可以帮助大家对于数据分析等有一个粗略的认识(不过因为我也还是个菜鸟,一定会有很多疏漏,希望大家多多指教!!!) 一个大...

  • 异常检测(1)

    1、什么是异常检测 异常检测(Outlier Detection),顾名思义,是识别与正常数据不同的数据,与预期行为差异大的数据。 识别如信用卡欺诈,工业生产异常,网络流里的...

  • SQL Tutorial 高级处理

    1. 窗口函数 1.1 基本定义 窗口函数也称为OLAP函数。OLAP 是OnLine AnalyticalProcessing 的简称,意思是对数据库数据进行实时分析处理。...

  • SQL Tutorial 集合运算

    1 表的加法–UNION 1.1 UNION 基本语法:SELECT product_id, product_nameFROM productUNIONSELECT prod...

  • SQL Tutorial 查询与排序 Lv2

    1. 视图 视图是一个虚拟的表,不同于直接操作数据表,视图是依据SELECT语句来创建的(会在下面具体介绍),所以操作视图时会根据创建视图的SELECT语句生成一张虚拟表,然...

  • SQL Tutorial 查询与排序

    1. SELECT 基本语句 - SELECT & FROM select 为从 database 中选取数据的最基本操作,主要包括 select 与 from。select...

  • 120
    SQL Tutorial (Datawhale 开源资料)

    # SQL Tutorial (Datawhale 开源资料) Task 00 环境搭建 本想用虚拟机安装MySQL,但是笔记本同时挂vpn再运行VM实在是卡的不行,最后选择...