fujindemi - 简书

发简信

fujindemi

21
关注
3
粉丝
12
文章
3360

字数
1

收获喜欢
2

总资产

IP属地：四川

冰阔落jack

音频特征提取方法和工具汇总
作者：冰阔落[http://km.oa.dragonest.com/pages/viewpage.action?pageId=52544567&src=contextnavp...

1376 0 3
申申申申申申

INN实现深入理解
FrEIA：Framework for Easily Invertible Architectures FrEIA 是实现 INN 的基础，可以理解为实现 INN 的最重要的...

5467 1 6 1
blackmanba_084b

Tensorflow(一) TFRecord生成与读取
TFRecord生成一、为什么使用TFRecord? 正常情况下我们训练文件夹经常会生成 train, test 或者val文件夹，这些文件夹内部往往会存着成千上万的图片或...

87295 10 65
shudaxu

低秩
低秩与稀疏，是机器学习领域非常重要的特性。在机器学习领域，实际上很多算法结构中都包含了低秩的思想，如在FM和word2vec的结构设计中（参考FM在时间空间复杂度的削减），...

2285 0 1
木木爱吃糖醋鱼

tf.slice()到底怎么切的，看不懂你掐死我
对于java起手的程序猿，python的计算多维度数组的方式真的是有点蛋疼。最近看代码的时候需要弄明白tf.slice()的具体操作方法。去看了看官方的注释和例子还是一头雾水...

43801 10 54
Johann_Liang

改进版的RoBERTa到底改进了什么？
在XLNet全面超越Bert后没多久，Facebook提出了RoBERTa（a Robustly Optimized BERT Pretraining Approach）。再...

20522 7 9
Wonshington

Ablation studies相关解释
Ablation studies 即模型简化测试顾名思义，就是去掉模型中的部分模块，然后看模型的性能是否发生变化。英文解释：An ablation study typic...

7360 0 3
VEnzo

Pytorch-反向传播怎么做
最近在看代码的过程中，需要知道错误是怎么样被反向传播回去的。所以查阅了一些相关资料，在此分享。其中有个问题是为什么在每个batch之前将参数的梯度设置为0呢？因为当使用ba...

6317 0 3
PROoshio

【代码解析】Transformer-XL 之 Relative Positional Encodings
[论文] 《Transformer-XL：Attentive Language Models beyond a Fixed-Length Context》- CMU & Go...

3012 0 3