第四周

课后问题

  1. 前向传播和后向传播中 cache 的含义
对前向传播变量进行缓存:在计算反向传播时,前向传播过程中得到的一些中间变量非常有用。在实际操作中,最好代码实现对于这些中间变量的缓存,这样在反向传播的时候也能用上它们。如果这样做过于困难,也可以(但是浪费计算资源)重新计算它们。

CS231n课程笔记翻译:反向传播笔记

  1. 什么是 hyperparameters 超参数
    个人感觉就是通过参数直接设置并且不会变的参数,影响计算结果,并不会因为训练集发生变化的参数
  2. 下面这句是正确的
There are certain functions with the following properties:

(i) To compute the function using a shallow network circuit, you will need a large network (where we measure size by the number of logic gates in the network), but (ii) To compute it using a deep network circuit, you need only an exponentially smaller network. 
  1. Forward propagation propagates the input through the layers, although for shallow networks we may just write all the lines (a[2]=g2, z[2]=W[2]a[1]+b[2], ...) in a deeper network, we cannot avoid a for loop iterating over the layers: (a[l]=gl, $$z^{[l]} = W{[l]}a{[l-1]} + b^{[l]}, ...).
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 呵呵呵呵
    一挑五阅读 149评论 0 0
  • 1 前段日子,王技师调到了分公司,负责指导线路维修。吴师傅在车辆机修车间做保洁,和他有点拐弯亲戚。按媳妇娘家的辈次...
    故事万花筒阅读 442评论 0 1
  • 《淮南子·览冥篇》:往古之时,四极废,九州裂,天不兼覆,地不周载,火炎而不灭,水浩洋而不息,猛兽食颛民,鸷鸟攫老弱...
    雨凉城阅读 757评论 33 11
  • 我们去实践活动
    冰润兰阅读 109评论 0 0