0

点赞

收藏

分享

Cartoon-Stylegan2：快来将你的图片漫画风

穿裙子的程序员 2022-04-13 阅读 57

标签: Stylegan 计算机视觉人脸生成

在这里插入图片描述
title

Cartoon-Stylegan : Fine-Tuning stylegan2 for cartoon face generation

author

Jihye Back

Link

论文地址：here

Code：here

Abstract

背景介绍等

本文通过finetune Stylegan2模型，完成图像到图像的翻译，为了使源图像和目标图像相似，例如制作成对图像，提出了两种方法：

（1）FreezeSG （冻结style向量和generator的初始blocks）。这个很简单，并且可以令目标图像遵循源图像的结构。

（2）Structure Loss（减小源generator和目标generator之间初始block的距离）。在这种loss训练下的模型加入层交换，效果也十分显著。

Method

Baseline : StyleGAN2-ADA + FreezeD

请添加图片描述

这种结构可以生成逼真的图像，但是它无法保持源域的结构。

Ours : FreezeSG (Freeze Style vector and Generator)

请添加图片描述

上图是通过相加style vector不同层，得到的实验结果。在Stylegan2中，style vector为n * 18 * 512，上图可以发现保留4层后，源图的结构也能大致留下。所以这也是作者想要冻结style vector低分辨率层的原因。

Freeze Style vector and Generator

请添加图片描述

with Layer Swapping

关于层交换，作者描述的不多，但是是借鉴于https://arxiv.org/abs/2010.05334这篇文章。原文中的介绍如下：

请添加图片描述

请添加图片描述

可以理解为，交换原generator和新generator低分辨率层的权重。（但目前存在的疑问在：如果通过其他pretrained模型进行fintune，冻结了低分辨率层，不也是相当于作了层交换…此处存疑）

Ours : Structure Loss

由于低分辨率层下优先确定图像结构，我将Structure Loss应用于低分辨率层的值，以便生成的图像与源域中的图像相似。 Structure Loss使得源生成器的 RGB 输出在训练期间被微调到与目标生成器的 RGB 输出具有相似的值。

请添加图片描述

Results

下面来看一看CartoonGAN生成的效果。

请添加图片描述

请添加图片描述

总结

该篇文章更像是作者的实验笔记，在实验过程中验证了记录下来的心得体会。

作者在前人的基础上，加入了冻结style vector的想法，试验效果良好
加入了structure loss，控制新generator生成的图像更贴近源generator生成的图像（更相似）
加入了Layer swap（合并其他的项目）

在这里插入图片描述

0 条评论

穿裙子的程序员

关注