0
点赞
收藏
分享

微信扫一扫

公众号内容拓展学习笔记(2022.3.1)

公众号内容拓展学习笔记(2022.3.1)


📎 今日要点

  1. TTFNet:改进CenterNet,使得训练时间缩短7倍 ⭐️⭐️

    • Abstract: TTFNet:改进CenterNet,使得训练时间缩短7倍
    • Paper: Training-Time-Friendly Network for Real-Time Object Detection
    • Code: https://github.com/ZJULearning/ttfnet
    • Tips: 本文是对CenterNet的一种改进,主要是增加了训练时参与回归的样本,提升了收敛速度,加快了训练时间,同时使用了椭圆高斯核来代替CenterNet中的圆形高斯核,感觉更加合理。
  2. SWideRNet:全景分割新标杆! ⭐️⭐️

    • Abstract: SWideRNet:全景分割新标杆!
    • Paper: [Scaling Wide Residual Networks for Panoptic Segmentation](paper: https://arxiv.org/abs/2011.11675)
    • Tips: 本文是DeepLab系列作者“Liang-Chieh Chen”大神在全景分割领域的又一力作。它在Wide-ResNet的基础上引入SE与"Switchable Atrous Convolution,SAC"两种改进,嵌入到Panoptic-DeepLab框架中并在全景分割领域取得了SOTA性能(在更快、更大模型配置方面均取得了SOTA指标)。
  3. 谷歌Quoc V. Le团队新作FLASH:高效Transformer新设计!训练成本暴减! ⭐️⭐️

    • Abstract: 谷歌Quoc V. Le团队新作FLASH,高效Transformer新设计
    • Paper: Transformer Quality in Linear Time
    • Code: https://github.com/DerrickXuNu/OpenCOOD
    • Tips: : 谷歌的新研究FLASH,让 transformer 模型的效率有了巨大提升,该方法的核心在于减少注意力机制。
  4. R-C3D 视频活动检测 ⭐️⭐️

    • Abstract: 视频活动检测经典模型 R-C3D
    • Paper: R-C3D: Region Convolutional 3D Network for Temporal Activity Detect
    • Code: http://ai.bu.edu/r-c3d/
    • Tips: 论文提出了活动检测模型,即R-C3D,这是一种端到端活动检测模型,结合活动建议和分类阶段,可以检测任意长度的活动。
  5. AAAI 2022 | RTPB: 针对无偏场景图生成的抵抗训练方法 ⭐️⭐️

    • Abstract: RTPB: 针对无偏场景图生成的抵抗训练方法
    • Paper: Resistance Training using Prior Bias: toward Unbiased Scene Graph Generation
    • Tips: 为抑制数据集长尾分布问题对场景图生成任务的影响,我们提出了一种基于数据集先验偏差的抵抗训练方法,基于训练集的统计信息,调整训练进程,抑制数据长尾分布对模型的影响,实现更加平衡的场景图生成。
  6. 谷歌和伯克利分校的新工作:规模化大场景的神经绘制方法Block-NeRF ⭐️⭐️

    • Abstract: 谷歌和伯克利分校的新工作:规模化大场景的神经绘制方法Block-NeRF
    • Paper: Block-NeRF: Scalable Large Scene Neural View Synthesis
    • Tips: Block-NeRF,一种可以代表大规模环境的Neural Radiance Fields(NeRF)变型。具体来说,规模化的NeRF渲染跨越多个块(blocks)的城市规模场景时,将场景分解为单独训练的NeRF。这种分解将渲染时间与场景大小分解,使渲染能够扩展到任意大的环境,并允许对环境进行逐块更新。

📎 Others

  • 由于图片权限问题,GitHub是完整版,可以点点 star
  • 星标的数量是与个人相关程度,不代表文章内容的好坏
  • 关注我的个人网站
  • 关注我的CSDN博客
  • 关注我的哔哩哔哩
  • 关注我的公众号CV伴读社

举报

相关推荐

0 条评论