-
起因
在我们日常处理数据的时候,最常见的一种便是遍历某个目录(或某个多级目录),对该目录下面的每个文件进行一定的处理。比方说,通过raw数据处理后得到精修的数据、检测数据集中的图片中的目标并且将检测结果按需保存。这似乎是一个很基础的任务,但是其实我们...
-
介绍
本篇论文提出了一种基于注意力机制的动态head,配合最近大火的强大的swin transformer作为backbone,在coco上首次实现了AP突破60。
论文地址
摘要
问题:之前的一些关于head的工作,致力于提升性能表现而没有提出一...
-
论文信息
2021 ICCV bestpaper
微软亚洲研究院
论文地址
项目地址
摘要
Vision Transformer的两个问题:
两个领域涉及的scale不同,NLP的scale是标准固定的,而CV的scale变化范围非常大。...
-
作者
上海交通大学,许志钦:https://ins.sjtu.edu.cn/people/xuzhiqin/pub.html
F-Principle
频率原则可以用一句话概括:深度学习倾向于优先拟合目标函数的低频部分
神经网络的特点:
OverPa...
-
论文地址
代码
摘要
背景:ViT的性能提升是因为Patches还是因为自注意力?
工作:
提出了ConvMixer,一个和ViT、MLP-Mixer相似的网络。
相似在什么地方呢?:ConvMixer直接以patch分割作为输入,分...
-
论文地址
代码地址
介绍
本篇论文提出了SENet,获得了最后一届ImageNet比赛的冠军.值得注意的是,它并没有采用特别复杂的结构,提出了一种通道自注意力机制,筛选更有意义的通道特征.本篇只是一个总结,参考了知乎,csdn上的一些论文解读.
解读...
-
介绍
翻译自illustrated transformer, 原作者为Jay Alammar,
原文地址:http://jalammar.github.io/illustrated-transformer/
主要介绍了Transforme...
-
应对雷达信息的稀疏性
雷达点云数据具有稀疏性,而图像数据是密集的,这使得融合难以有效进行。先前的学者通过柱扩张的方式强行使得雷达数据更加稠密,这虽然有一定的效果,但是还是难以起到很好的说服力。
柱扩张及其变式
这类方法主要针对点云数据,他们都...
-
Author
Ramin Nabati
Qi Hairong
From: Department of Electrical Engineering and Computer Science The University of Tennessee K...
-
sensor fusion
这篇主要还是总结了一下关于异类融合的方法、算法。
相机、激光雷达、雷达传感器的特点对比
这张表清晰地给出了他们的优劣势,有力地回答了一个问题:我们为什么要研究异类信息融合?
说白了就是:取长补短,得到总体更好的感知效果。
...