Telegram Channel
读完这本著名的《Deep Learning》。此书专注于传统神经网络的数学解释,介绍了相关数学基础、感知器、深度网络、CNN、RNN,还有模型训练、评估、迁移学习、对抗网络等多方面的数学知识,可惜没有包含强化学习。

我不是算法研究员,只是一名工程人员,读的不是很细,也不追求理论上的完全掌握,只希望能对技术实现有高层次的理解,知道它们是什么,适用用来处理什么任务,就足够了。

阅读此书我还有个收获是,作者经常用寥寥数语就透彻地阐述了一些数学概念的实际意义。

比如我们如此执着于为矩阵计算特征值和特征向量的目的,就在于矩阵运算很复杂,而将向量投影到特征向量空间后,相对应的矩阵运算就成为了简单的特征值倍数的拉伸操作,极大简化了计算复杂度。

还有 CNN 里的卷积核,名字听上去很吓人,实际上就是用一个低维小张量(卷积核)取代一整层的权重参数,然后对着一层的每一组 input 重复使用这个核去求算下一层的输入。这种做法极大缩减了模型的总参数量,而且对于“计算相邻像素差值”之类的图像识别任务非常有效。

开卷有益,即使没读懂也能有所收获。 #book
 
 
Back to Top Telegram Channel