2017.08.14,结束了两周的等待,如愿以偿开始了自己的美团实习生活,本来抱着三五个月走人,争取下一份实习的心态,没想到一直到转为暑期实习生、到通过留用面试、再到年后继续...
2017.08.14,结束了两周的等待,如愿以偿开始了自己的美团实习生活,本来抱着三五个月走人,争取下一份实习的心态,没想到一直到转为暑期实习生、到通过留用面试、再到年后继续...
之前介绍的DQN及其各种变体,网络输出的都是状态-动作价值Q的期望预估值。而本文将介绍的Categorical DQN,它建模的是状态-动作价值Q的分布。这样的估计方法使得估...
写的非常棒,抓住了精髓
信赖域策略优化(TRPO)根据策略梯度方法,参数更新方程式为: 在策略梯度方法中,合适的步长对于参数更新至关重要,当步长不合适时,更新的参数所对应的策略是一个更不好的策略,当利用这个更不好的策略进行采...
根据策略梯度方法,参数更新方程式为: 在策略梯度方法中,合适的步长对于参数更新至关重要,当步长不合适时,更新的参数所对应的策略是一个更不好的策略,当利用这个更不好的策略进行采...
ElasticFusion: Dense SLAM Without A Pose Graph 没有姿态图稠密SLAM [TOC] 摘要 提出了一种实时密集视觉SLAM的新方法...
正文前的扯淡 之前电话面试一个公司时,面试官让写一个堆排序,遗憾的是我忘了堆排序的思想了,所以直接说不会写,这次电面也以失败告终...知耻后勇,这几天在网上找了很多写堆排序的...
本节课主要将两件事情: 1. Pytorch 搭建分类神经网络 2. 神经网络基本架构 --- 0 项目准备: 这里先下载数据,这里主要是下载手写 mnist 数据集; 这个...
这次看下wgan脚本,这里使用fastai来完成wgan的训练和使用。 老三样,我就不加标题了 1 重要的包 其中gan包是在../fastai/vision下的文件夹。大家...
文章: Focal Loss for Dense Object Detection 作者: Tsung-Yi Lin, Priya Goyal, Ross Girshick,...
roidb数据结构 roidb的类型是list, 其中的每个元素的数据类型都是dict, roidb列表的长度为数据集的数量(即图片的数量), roidb中每个元素的详细情况...
8.1 R-FCN R-FCN属于two-stage的目标检测算法。 backbone部分RPN,这里使用ResNet。 head部分R-FCN,使用全连接网络。 其中Res...