面试题:过拟合原因

更多面试题关注"算法狗"有劳动下手指啦

-------------------------------------------------

(1)建模样本选取有误,样本标签错误等,导致选取的样本数据不足以代表预定的分类规则 

(2)样本噪音干扰过大,使得机器将学习了噪音,还认为是特征,从而扰乱了预设的分类规则

 (3)假设的模型无法合理存在,或者说是假设成立的条件实际并不成立

(4)参数太多,模型复杂度过高

(5)对于tree-based模型,如果我们对于其深度与split没有合理的限制,有可能使节点只包含单纯的事件数据(event)或非事件数据(no event),使其虽然可以完美匹配(拟合)训练数据,但是无法适应其他数据集 

(6)对于神经网络模型:1.权值学习迭代次数太多(Overtraining),2。BP算法使权值可能收敛过于复杂的决策面

喜欢就关注一下啦~~~

更多面试题----------------------

基础概念

逻辑回归与朴素贝叶斯有什么区别

机器学习学习方式主要有哪些?

监督学习的步骤主要有哪些?

逻辑回归与朴素贝叶斯有什么区别

线性回归和逻辑回归的区别

代价函数,损失函数和目标函数的区别?

随机梯度下降法、批量梯度下降法有哪些区别?

LDA和PCA区别?

降维的必要性和目的是什么?

误差、偏差和方差的区别是啥?

梯度下降法缺点

批量梯度下降和随机梯度下降法的缺点?

如何对梯度下降法进行调优?

如何解决欠拟合

过拟合原因

如何解决过拟合

GBM

简单介绍一下XGBoost

XGBoost与GBDT的联系和区别有哪些?

为什么XGBoost泰勒二阶展开后效果就比较好呢?

XGBoost对缺失值是怎么处理的?

XGBoost为什么快

XGBoost防止过拟合的方法

XGBoost为什么若模型决策树的叶子节点值越大,越容易过拟合呢?

XGBoost为什么可以并行训练?

XGBoost中叶子结点的权重如何计算出来

XGBoost中的一棵树的停止生长条件

Xboost中的min_child_weight是什么意思

Xgboost中的gamma是什么意思

Xgboost中的参数

RF和GBDT的区别

xgboost本质上是树模型,能进行线性回归拟合么

Xgboos是如何调参的

为什么xgboost/gbdt在调参时为什么树的深度很少就能达到很高的精度?

为什么常规的gbdt和xgboost不适用于类别特别多的特征?

怎么处理类别特征在树模型下?

集成学习方法

bagging和boosting区别

为什么bagging减少方差

什么场景下采用bagging集成方法

bagging和dropout区别

为什么说bagging是减少variance,而boosting是减少bias?

adaboost为什么不容易过拟合?

组合弱学习器的算法?

DL

基础理论

说一下局部最优与全局最优的区别?

深度学习里,如何判断模型陷入局部最优?

Transfomer

Transformer为何使用多头注意力机制?

Transformer 相比于 RNN/LSTM,有什么优势?为什么

Transformer为什么Q和K使用不同的权重矩阵生成,为何不能使用同一个值进行自身的点乘?

Transformer计算attention的时候为何选择点乘而不是加法?两者计算复杂度和效果上有什么区别?

为什么在进行softmax之前需要对attention进行scaled

说一下在计算attention score的时候如何对padding做mask操作?

为什么在进行多头注意力的时候需要对每个head进行降维?

大概讲一下Transformer的Encoder模块?

简单介绍一下Transformer的位置编码?有什么意义和优缺点?

你还了解哪些关于位置编码的技术,各自的优缺点是什么?

简单讲一下Transformer中的残差结构以及意义。

为什么transformer块使用LayerNorm而不是BatchNorm?LayerNorm 在Transformer的位置是哪里?

简答讲一下BatchNorm技术,以及它的优缺点。

简单描述一下Transformer中的前馈神经网络?使用了什么激活函数?相关优缺点?

Decoder阶段的多头自注意力和encoder的多头自注意力有什么区别?

Transformer的并行化提现在哪个地方?

Decoder端可以做并行化吗?

简单描述一下wordpiece model 和 byte pair encoding,有实际应用过吗?

Transformer训练的时候学习率是如何设定的?Dropout是如何设定的,位置在哪里?Dropout 在测试的需要有什么需要注意的吗?

bert的mask为何不学习transformer在attention处进行屏蔽score的技巧?

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 223,207评论 6 521
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 95,455评论 3 400
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 170,031评论 0 366
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 60,334评论 1 300
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 69,322评论 6 398
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 52,895评论 1 314
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 41,300评论 3 424
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 40,264评论 0 277
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 46,784评论 1 321
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 38,870评论 3 343
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 40,989评论 1 354
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 36,649评论 5 351
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 42,331评论 3 336
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 32,814评论 0 25
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,940评论 1 275
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 49,452评论 3 379
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 45,995评论 2 361

推荐阅读更多精彩内容

  • 更多面试题关注"算法狗"有劳动下手指啦 -------------------------------------...
    bd7e4a65be2b阅读 316评论 0 0
  • 相同点 (1)两者的作用是用来降维的 (2)两者都假设符合高斯分布 不同点 (1)LDA是有监督的降维方法,PCA...
    bd7e4a65be2b阅读 707评论 0 0
  • 自然语言处理面试题 有哪些文本表示模型,它们各有什么优缺点? 词袋模型与N-gram  最基本的文本表示模型是词袋...
    Viterbi阅读 3,918评论 0 1
  • 1. SVM、LR、决策树的对比? LR实现简单,训练速度非常快,但是模型较为简单。 决策树容易过拟合,需要进行剪...
    李涛AT北京阅读 1,532评论 0 3
  • 一 面试题概述 面试的时候,面试官会结合你的回答和你的简历来询问你,所以在写简历的时候,简历上所写的所有内容在写的...
    摩天轮的守候阅读 14,055评论 2 69