0
点赞
收藏
分享

微信扫一扫

Cartoon-Stylegan2:快来将你的图片漫画风

在这里插入图片描述
title

Cartoon-Stylegan : Fine-Tuning stylegan2 for cartoon face generation

author

Jihye Back

Link

论文地址:here

Code:here


Abstract

背景介绍等

本文通过finetune Stylegan2模型,完成图像到图像的翻译,为了使源图像和目标图像相似,例如制作成对图像,提出了两种方法:

(1)FreezeSG (冻结style向量和generator的初始blocks)。这个很简单,并且可以令目标图像遵循源图像的结构。

(2)Structure Loss(减小源generator和目标generator之间初始block的距离)。在这种loss训练下的模型加入层交换,效果也十分显著。

Method

Baseline : StyleGAN2-ADA + FreezeD

请添加图片描述

这种结构可以生成逼真的图像,但是它无法保持源域的结构。

Ours : FreezeSG (Freeze Style vector and Generator)

请添加图片描述

上图是通过相加style vector不同层,得到的实验结果。在Stylegan2中,style vector为n * 18 * 512,上图可以发现保留4层后,源图的结构也能大致留下。所以这也是作者想要冻结style vector低分辨率层的原因。

Freeze Style vector and Generator

请添加图片描述

with Layer Swapping

关于层交换,作者描述的不多,但是是借鉴于https://arxiv.org/abs/2010.05334这篇文章。原文中的介绍如下:

请添加图片描述

请添加图片描述

可以理解为,交换原generator和新generator低分辨率层的权重。(但目前存在的疑问在:如果通过其他pretrained模型进行fintune,冻结了低分辨率层,不也是相当于作了层交换…此处存疑)

Ours : Structure Loss

由于低分辨率层下优先确定图像结构,我将Structure Loss应用于低分辨率层的值,以便生成的图像与源域中的图像相似。 Structure Loss使得源生成器的 RGB 输出在训练期间被微调到与目标生成器的 RGB 输出具有相似的值。

请添加图片描述

Results

下面来看一看CartoonGAN生成的效果。

请添加图片描述

请添加图片描述

总结

该篇文章更像是作者的实验笔记,在实验过程中验证了记录下来的心得体会。

  • 作者在前人的基础上,加入了冻结style vector的想法,试验效果良好
  • 加入了structure loss,控制新generator生成的图像更贴近源generator生成的图像(更相似)
  • 加入了Layer swap(合并其他的项目)

在这里插入图片描述

举报

相关推荐

0 条评论