公众号内容拓展学习笔记(2022.3.1)
📎 今日要点
-
TTFNet:改进CenterNet,使得训练时间缩短7倍 ⭐️⭐️
- Abstract: TTFNet:改进CenterNet,使得训练时间缩短7倍
- Paper: Training-Time-Friendly Network for Real-Time Object Detection
- Code: https://github.com/ZJULearning/ttfnet
- Tips: 本文是对CenterNet的一种改进,主要是增加了训练时参与回归的样本,提升了收敛速度,加快了训练时间,同时使用了椭圆高斯核来代替CenterNet中的圆形高斯核,感觉更加合理。
-
SWideRNet:全景分割新标杆! ⭐️⭐️
- Abstract: SWideRNet:全景分割新标杆!
- Paper: [Scaling Wide Residual Networks for Panoptic Segmentation](paper: https://arxiv.org/abs/2011.11675)
- Tips: 本文是DeepLab系列作者“Liang-Chieh Chen”大神在全景分割领域的又一力作。它在Wide-ResNet的基础上引入SE与"Switchable Atrous Convolution,SAC"两种改进,嵌入到Panoptic-DeepLab框架中并在全景分割领域取得了SOTA性能(在更快、更大模型配置方面均取得了SOTA指标)。
-
谷歌Quoc V. Le团队新作FLASH:高效Transformer新设计!训练成本暴减! ⭐️⭐️
- Abstract: 谷歌Quoc V. Le团队新作FLASH,高效Transformer新设计
- Paper: Transformer Quality in Linear Time
- Code: https://github.com/DerrickXuNu/OpenCOOD
- Tips: : 谷歌的新研究FLASH,让 transformer 模型的效率有了巨大提升,该方法的核心在于减少注意力机制。
-
R-C3D 视频活动检测 ⭐️⭐️
- Abstract: 视频活动检测经典模型 R-C3D
- Paper: R-C3D: Region Convolutional 3D Network for Temporal Activity Detect
- Code: http://ai.bu.edu/r-c3d/
- Tips: 论文提出了活动检测模型,即R-C3D,这是一种端到端活动检测模型,结合活动建议和分类阶段,可以检测任意长度的活动。
-
AAAI 2022 | RTPB: 针对无偏场景图生成的抵抗训练方法 ⭐️⭐️
- Abstract: RTPB: 针对无偏场景图生成的抵抗训练方法
- Paper: Resistance Training using Prior Bias: toward Unbiased Scene Graph Generation
- Tips: 为抑制数据集长尾分布问题对场景图生成任务的影响,我们提出了一种基于数据集先验偏差的抵抗训练方法,基于训练集的统计信息,调整训练进程,抑制数据长尾分布对模型的影响,实现更加平衡的场景图生成。
-
谷歌和伯克利分校的新工作:规模化大场景的神经绘制方法Block-NeRF ⭐️⭐️
- Abstract: 谷歌和伯克利分校的新工作:规模化大场景的神经绘制方法Block-NeRF
- Paper: Block-NeRF: Scalable Large Scene Neural View Synthesis
- Tips: Block-NeRF,一种可以代表大规模环境的Neural Radiance Fields(NeRF)变型。具体来说,规模化的NeRF渲染跨越多个块(blocks)的城市规模场景时,将场景分解为单独训练的NeRF。这种分解将渲染时间与场景大小分解,使渲染能够扩展到任意大的环境,并允许对环境进行逐块更新。
📎 Others
- 由于图片权限问题,GitHub是完整版,可以点点 star
- 星标的数量是与个人相关程度,不代表文章内容的好坏
- 关注我的个人网站
- 关注我的CSDN博客
- 关注我的哔哩哔哩
- 关注我的公众号CV伴读社