您现在的位置是:首页 >技术交流 >【Few Shot数据集】CUB-200-2011 鸟类网站首页技术交流

【Few Shot数据集】CUB-200-2011 鸟类

hjxu2016 2023-06-06 04:00:02
简介【Few Shot数据集】CUB-200-2011 鸟类


CUA-200-2011 是CUB-200的拓展,包含了200个鸟类,共11788张图片,每张图片都标注了物体的框、关键点和属性类别,常被用于小样本细粒度图像分类或者检测任务中。

一、数据下载

官网下载:https://www.vision.caltech.edu/datasets/cub_200_2011/

百度云下载 链接: https://pan.baidu.com/s/1o60hA0qrupDjtMGPVCke3A 密码: u0sr

数据发布的论文下载: https://authors.library.caltech.edu/27452/1/CUB_200_2011.pdf

二、数据介绍

CUA-200-2011 是CUB-200的拓展,包含了200个鸟类,通常用于小目标分类、检测等任务。
所有的图片都是注释了 bounding boxes, part locations, 和属性。
图像和标注都是手工进行的。
在这里插入图片描述
下载后,解压如上所示,包含3个文件夹,5个标签文档,和一个README说明文档。

  • images 文件夹 有200个子文件夹,每个文件夹存放着对应图像类别的图片
    在这里插入图片描述

  • parts 文件夹 存放着每个图像的关键点标注信息 ,包含了三个文件
    在这里插入图片描述

    • parts/parts.txt : 关键点种类以及对应的类别,每行格式为 <part_id> <part_name>
    • parts/part_locs.txt : 包含了所有的关键点的标注,每行格式为<image_id> <part_id>
    • parts/part_click_locs.txt : 每一行对应于不同MTurk工作人员对特定图像中特定关键点的标注,每行格式为<image_id> <part_id>
  • attributes 文件夹 放着标注的一些属性
    在这里插入图片描述

    • attributes/certainties.txt :确定的属性,代表着标注人员标注时对类别是否确定的信息,每行格式为<certainty_id> <certainty_name> 其中 0 代表看不见,1 代表猜测的,2 代表可能,4 代表确定
    • attributes/image_attribute_labels.txt : 图像感知属性标注。<image_id> <attribute_id> <is_present> <certainty_id>
  • images.txt 包含每张图片的名字以及对应的序列号, 每行格式为<image_id> <image_name>

  • train_test_split.txt 推荐的训练集和测试集划分,每行格式为 <image_id> <is_training_image>

  • image_class_labels.txt 每张图片对应的类别,每行格式为 <image_id> <class_id>

  • classes.txt 图像class类别以及对应的类别ID,每行格式为 <class_id> <class_name>

  • bounding_boxes.txt 每张图像的物体框 ,每行格式为 <image_id>

3.1 图案示意

在这里插入图片描述

3.2 标注属性

标注的关键点和属性,15个关键点(喙眼头背等),28个属性组(喙的形状、颜色、长等、背部有颜色,有图案等)
见下图在这里插入图片描述

在这里插入图片描述

风语者!平时喜欢研究各种技术,目前在从事后端开发工作,热爱生活、热爱工作。