您现在的位置是:首页 >技术交流 >image adaptive 3dlut based on deep learning网站首页技术交流

image adaptive 3dlut based on deep learning

tony365 2024-06-15 06:31:11
简介image adaptive 3dlut based on deep learning

image adaptive 3dlut based on deep learning

1. Learning Image-adaptive 3D Lookup Tables for High Performance Photo Enhancement in Real-time

在这里插入图片描述

图像输入一个卷积网络输出3个weight,
初始化3个3dlut

weight 和 3dlut 合成为一个,然后三线性插值得到 pred, 与target建立损失。

2. CLUT-Net: Learning Adaptively Compressed Representations of 3DLUTs for Lightweight Image Enhancement

2.1 3dlut分析

Given a specific color channel ? where ? ∈ {?, ?, ?} and the other two channels denoted by ?
and ?, we find that the output value 3Dlut(?) is strongly correlated to the input value of channel ? while weakly correlated to the input values ???, ??? of channel ? and ?, respectively.

意思是R 通道的3Dlut 与R相关性更大, 与GB通道相关性小
G 通道的3Dlut 与R相关性更大, 与RB通道相关性小
B 通道的3Dlut 与R相关性更大, 与RG通道相关性小

因此,对于R通道的3Dlut, 原本是 17 * 17 * 17 个节点, 作者替换为 S * W
请添加图片描述

2.2 具体方法

主要是 矩阵分解的思想, 然后再重建
重建:
在这里插入图片描述

由两个矩阵 Ms, Mw, 压缩后的Clut 重建为原始 3dlut

2.3 主要原理

在这里插入图片描述

主要是对3dlut进行压缩处理,降低参数量,提高效率。

首先同样是 学习得到 weight 和 basis Cluts。
然后还有两个矩阵需要学习得到。一共这三个模块

其中bisis Cluts和两个矩阵 Ms, Mw在推理阶段是不变化的。

2.4 实验结果

FiveK: PSNR, SSIM, deltaE 三种评价标准
在这里插入图片描述

3. 4D LUT: Learnable Context-Aware 4D Lookup Table for Image Enhancement

在这里插入图片描述

4D lut: 输入r,g,b,context 输出r,g,b
增加一个图像内容context map : achieve content-dependent image enhancement
在这里插入图片描述

原理和3dlut类似, 框架如下很容易明白:

学习 weight, bisis 4dluts, context map

本来生成的3dlut就是image-adaptive,因为weight是每个图像都不同的。 这篇论文又多一个维度说是content map, 这样效果就有提升?

作者实验确实有提升,而且context map越大的地方相比3dlut提升越好:
在这里插入图片描述

4. RSFNet A White-Box Image Retouching Approach using Region-Specific Color Filters

4.1 选择10个图像处理方法(或者叫做filter)

We select 10 commonly used retouching filters from traditional tools(e.g., Davinci Resolve)
to represent adjustment manipulations, including contrast,
saturation, hue, temperature, shadows, midtones, highlights
and shift.

4.2 预测每个filter的参数

比如 亮度 ±, 饱和度±

在这里插入图片描述

h-map 预测 K 个 map
h-arg 为每个map 预测 N 个filter的参数

然后每个map,N个filter 调整后,得到 K 个 image
K个image 加权融合,再shift得到最终的output

在这里插入图片描述

5. Flexible Piecewise Curves Estimation for Photo Enhancement

5.1 什么是PNG curve

在这里插入图片描述

就是一个分段函数,每一段都是非线性的。

一个PNG curve可以有 knot节点,和非线性的参数 得到。
然后就得到了一个1D lut曲线。

其实有点麻烦,直接预测1D lut就可以呀。

5.2 网络结构

主要原理如下:
在这里插入图片描述

其中MT net: 预测 knot , parameter, 这两个构成 global look up table

然后还有 confidence map, 用于local adjust
在这里插入图片描述

5.3 Spatial-Adaptive Confidence Map Fusion

3个global 调整后的图像,与 3个confidence map 加权就是 final output

在这里插入图片描述

6. Neural Color Operators for Sequential Image Retouching

和 RSFNet A White-Box Image Retouching Approach using Region-Specific Color Filters
思想类似,方法不同。

6.1 NOP (neural color operators)

这里是 利用NOP模仿 传统图像操作方法,文中模仿的是 black clipping, exposure, and vibrance in Lightroom.
通过优化的方法模仿:首先制作 三种方法的图像,然后训练:
在这里插入图片描述

模仿后NOP就有了,其实是初始化,后面训练的时候仍然会被更新。

6.2 strength predictor就是一个小网络预测 三个 NOP 的强度。

最终训练和网络架构如下:
在这里插入图片描述

7. AdaInt: Learning Adaptive Intervals for 3D Lookup Tables on Real-time Image Enhancement

用一张图说一下它的原理:
相比与之前的3dlut, 多了一个 position 预测, 就是以前的3dlut都是均匀的坐标分布,这里分别为RGB三个通道预测 采样的坐标位置。

原因是啥呢? 因为一个图像可能只覆盖一小部分3dlut, 浪费了很多信息。 而通过non-uniform 3dlut可以更精细的处理图像。

在这里插入图片描述

8. SepLUT: Separable Image-adaptive Lookup Tables for Real-time Image Enhancement

这个相比与3dlut 多了 r,g,b 的1D lut.

在这里插入图片描述

代码中 1dlut和 3dlut的表示相比于Learning Image-adaptive 3D Lookup Tables for High Performance Photo Enhancement in Real-time 更简单优秀, 3dlut直接利用fc的weight来表示。

风语者!平时喜欢研究各种技术,目前在从事后端开发工作,热爱生活、热爱工作。