您现在的位置是:首页 >学无止境 >【深度学习实战:kaggle自然场景的图像分类-----使用keras框架实现vgg16的迁移学习】网站首页学无止境

【深度学习实战:kaggle自然场景的图像分类-----使用keras框架实现vgg16的迁移学习】

机器学习司猫白 2025-02-12 12:01:02
简介【深度学习实战:kaggle自然场景的图像分类-----使用keras框架实现vgg16的迁移学习】

Hello 大家好,今天和大家分享一个kaggle自然场景的图像分类的竞赛,使用的keras框架实现vgg16的迁移学习完成自然场景分类,对数据集感兴趣的同学可以在上方下载数据集。
在这里插入图片描述

项目简介

本次数据集来自kaggle,该数据集包括自然场景的图像。模型应该预测每个图像的正确标签。
您的目标是实现分类问题的高精度。

数据集

train.csv - 训练集
test.csv - 测试集
SceneImages - 图像文件夹

训练集的数据格式如下:

image_name label
0.jpg 0
1.jpg 4
2.jpg 5
7.jpg 4
8.jpg 1
9.jpg 5

在这里插入图片描述
在这里插入图片描述
一共有7000多张风景图。

迁移学习

迁移学习的原理

迁移学习(Transfer Learning)是一种机器学习方法,它的核心思想是将已经学到的知识应用到新的任务上。这就像是从一个领域的经验中借鉴来帮助解决另一个相关的任务。

生活中的类比

想象你已经学会了骑自行车。现在你需要学骑摩托车,尽管这两者有所不同,但你已经掌握了保持平衡、控制方向等技能。因此,你学骑摩托车时会比从零开始快很多。

在机器学习中,迁移学习的过程也类似:它利用在一个任务上训练得到的模型,来加速另一个相关任务的学习。

为什么使用迁移学习?

  • 数据有限:
    有时候,收集和标注大量数据是非常困难的。迁移学习可以帮助你在数据不充足的情况下,仍然训练出一个高性能的模型。
  • 节省计算资源:
    训练一个深度学习模型需要大量的计算资源和时间。迁移学习通过使用已有的预训练模型,避免了从头开始训练的巨大开销。
  • 提高模型表现:
    预训练模型已经学到了一些基础特征(例如图像的边缘、颜色、形状等),这些特征可以被迁移到新任务中,从而提升模型的准确度。

迁移学习的流程

  1. 选择预训练模型:
    首先,选择一个在大型数据集(如 ImageNet)上训练好的模型。这个模型已经学会了很多通用的特征,如图像中的边缘、颜色等。
    微调模型:

  2. 然后,将这个预训练模型应用到你的任务中。你可以对模型进行“微调”——即保留大部分已经学到的知识,只调整最后几层,或者仅训练最后一层来适应你的任务。
    优化和调整:

  3. 根据具体任务,你可能还需要调整模型的参数或网络结构,以进一步提升性能。

迁移学习的实际应用

图像分类:许多人使用在大规模数据集(如 ImageNet)上训练的预训练模型,解决特定的图像分类任务(如植物识别、动物分类等)。这些模型已学到的图像特征在新任务中同样有效。

自然语言处理(NLP):类似地,像 BERT、GPT 等预训练的语言模型已经从大量文本数据中学习了语言的结构和模式,这些知识可以快速应用到具体任务(如情感分析、文本生成等)。

总结
迁移学习是一种通过借用在一个任务中获得的知识,来帮助解决另一个相关任务的方法。它能显著加速模型的训练过程,特别适用于数据稀缺或计算资源有限的情况。就像骑自行车的经验可以帮助你更快学会骑摩托车,迁移学习同样能让你在新的任务上事半功倍。

Vgg16

VGG16 是一种非常流行的卷积神经网络(CNN)架构,由 Visual Geometry Group (VGG) 提出,通常用于图像分类任务。它以其简单、易理解且效果优异的网络结构闻名,尤其在大规模图像数据集(如 ImageNet)上取得了显著的成功。

  1. VGG16 的架构
    VGG16 网络包含 16 个层,具体包括:

13 个卷积层:每个卷积层使用大小为 3x3 的卷积核,步幅(stride)为 1,并且有 padding 保证图像尺寸不变。
3 个全连接层:这三个全连接层用于分类,每个全连接层后面跟一个 ReLU 激活函数。
最大池化层(MaxPooling):每两个卷积层后面接一个最大池化层,池化窗口大小为 2x2,步幅为 2。
Softmax 层:用于最终的分类输出。

本次迁移学习使用vgg16为例,再其架构上进行部分微调以适用于本次任务。

源码及解释

首先导入需要的库

import os
import pandas as pd
import numpy as np
from tensorflow.keras.preprocessing.image import ImageDataGenerator, load_img, img_to_array
from tensorflow.keras.applications import VGG16
from tensorflow.keras.models import Model, Sequential
from tensorflow.keras.layers import Dense, Flatten, Dropout, GlobalAveragePooling2D
from tensorflow.keras.optimizers import Adam
from sklearn.model_selection import train_test_split
from tensorflow.keras.utils import to_categorical
from tensorflow.keras.callbacks import ModelCheckpoint, EarlyStopping
# 路径和文件
data_file = '/kaggle/input/skku-2024-1-machine-learning-third-project/train.csv'
image_dir = '/kaggle/input/skku-2024-1-machine-learning-third-project/SceneImages/'
test_data_file = '/kaggle/input/skku-2024-1-machine-learning-third-project/test.csv'

# 加载标签数据
df = pd.read_csv(data_file)
df['image_path'] = df['image_name'].apply(lambda x: os.path.join(image_dir, x))

# 加载测试集数据
test_df = pd.read_csv(test_data_file)
test_df['image_path'] = test_df['image_name'].apply(lambda x: os.path.join(image_dir, x))

# 打印数据集信息
print("Dataframe head:")
print(df.head())
风语者!平时喜欢研究各种技术,目前在从事后端开发工作,热爱生活、热爱工作。