2024.08.01:此版块将开始重新更新,以经典架构的复现为主
高级基础结构的源码实现
尽管现有的多种技术都已经有很好用的开源代码,但我认为有些经典的结构非常有必要自己从底层完全实现一遍,这样才能真正理解每个模型的意义。因此本栏目强调从“0”开始构建。但像MLP、卷积层这样的底层架构我们不会再自己手动写,而是直接使用pytorch的功能,但详细原理和实现可以参考本人写的MiniTorch项目学习全攻略。
Transformer: Attention is all you need
基础网络结构
基础网络功能,简单的实战项目。用于快速掌握各种基础神经网络。