博客
关于我
谷歌最新提出无需卷积、注意力 ,纯MLP构成的视觉架构
阅读量:345 次
发布时间:2019-03-04

本文共 637 字,大约阅读时间需要 2 分钟。

11年it研发经验,从一个会计转行为算法工程师,学过C#,c++,java,android,php,go,js,python,CNN神经网络,四千多篇博文,三千多篇原创,只为与你分享,共同成长,一起进步,关注我,给你分享更多干货知识!

谷歌最新提出无需卷积、注意力 ,纯MLP构成的视觉架构

论文链接:https://arxiv.org/pdf/2105.01601.pdf

代码链接:https://github.com/google-research/vision_transformer

香港科技大学李铎同学的pytorch版的复现:https://github.com/d-li14/mlp-mixer.pytorch

 

这是pytorch的代码,加上了测试脚本

model size 70.96 m

 

import torchimport torch.nn as nnclass MlpBlock(nn.Module):    def __init__(self, hidden_dim, mlp_dim):        super(MlpBlock, self).__init__()        self.mlp = nn.Sequential(            nn.Linear(hidden_dim, mlp_dim),            nn.GELU(),            nn.Linear(mlp_dim, hidden_dim)   

转载地址:http://mrdr.baihongyu.com/

你可能感兴趣的文章
蓝桥杯备战——刷题(2019)
查看>>
ArcMap|栅格计算器报错
查看>>
《小石潭记》古文鉴赏
查看>>
Matlab中有关字符串数组的常见问题解答
查看>>
未定义的变量“py”或函数“py.command”
查看>>
我们,都一样......(句句入心)
查看>>
总结了一下c/c++函数和变量的命名规则
查看>>
关于构造函数内调用虚函数的问题
查看>>
最短路径问题—Dijkstra算法
查看>>
求二叉树的深度
查看>>
录音功能
查看>>
c++面经基础知识汇总(类型转换、new/delete/malloc/free、什么是RTTI)
查看>>
mysql时间相关函数和操作
查看>>
万物皆可爬系列查看翻页翻到最后是什么
查看>>
python scrapy
查看>>
pymongo的使用
查看>>
A Guide to Node.js Logging
查看>>
前端基础知识学习FreeCodeCamp
查看>>
css的一些基础知识
查看>>
webwxbatchgetcontact一个神奇的接口
查看>>