您现在的位置是：首页 >学无止境 >Yolov8轻量级：Next-vit，用于现实工业场景的下一代视觉 Transformer网站首页 学无止境

Yolov8轻量级：Next-vit，用于现实工业场景的下一代视觉 Transformer

AI小怪兽 2024-08-17 00:01:02

简介Yolov8轻量级：Next-vit，用于现实工业场景的下一代视觉 Transformer

1.Next-vit介绍

论文：https://arxiv.org/pdf/2207.05501.pdf

由于复杂的注意力机制和模型设计，大多数现有的视觉 Transformer（ViT）在现实的工业部署场景中不能像卷积神经网络（CNN）那样高效地执行。这就带来了一个问题：视觉神经网络能否像 CNN 一样快速推断并像 ViT 一样强大？

主要贡献总结如下：

1）开发了具有部署友好机制的强大卷积块和变换块，即NCB和NTB。Next-ViT堆栈NCB和NTB 构建先进的CNN-Transformer混合架构。

2）从一个新的角度设计了一种创新的CNN Transformer混合策略，该策略可以高效地提高性能。

3）介绍了Next ViT。大量实验证明了Next ViT的优势。它在TensorRT和CoreML上实现了图像分类、目标检测和语义分割的SOTA延迟/精度权衡。

Next-ViT 的研究团队通过开发新型的卷积块（NCB）和 Transformer 块（NTB），部署了友好的机制来捕获局部和全

风语者！平时喜欢研究各种技术，目前在从事后端开发工作，热爱生活、热爱工作。

上一篇
Docker（一）

下一篇
人工智能十年回顾 —— 从图像分类到聊天...

站长推荐

QT多线程的5种用法，通过使用线程解决UI主界面的耗时操作代码，防止界面卡死。
QT多线程的5种用法，通过使用线程解决UI主界面的耗时操作代码，防止界面卡死。...
U8W/U8W-Mini使用与常见问题解决
U8W/U8W-Mini使用与常见问题解决
stm32使用HAL库配置串口中断收发数据（保姆级教程）
stm32使用HAL库配置串口中断收发数据（保姆级教程）
分享几个国内免费的ChatGPT镜像网址(亲测有效)
分享几个国内免费的ChatGPT镜像网址(亲测有效)
Allegro16.6差分等长设置及走线总结
Allegro16.6差分等长设置及走线总结