208 日 , 2025 0:46:41

几个GAN算法训练模型的表现:

概念 理解 正常表现 异常表现
模式坍塌 生成器偷懒,只生成一种样本 生成多样化样本 生成单一或重复样本
梯度爆炸 模型更新太猛,直接崩溃 梯度在合理范围内波动 梯度突然变得极大(如几百或NaN)
梯度消失 模型更新不动,训练停滞 梯度稳定更新 梯度接近0,模型不更新

 

评论

  1. Windows Chrome
    4 周前
    2025-4-10 17:37:59

    现在初中都学这些了? 感觉这都是大学的知识了吧,还是博主多年前是初中,现在都已经工作了?

    • Mimosa233
      站长
      亮剑
      Windows Edge
      4 周前
      2025-4-10 21:00:39

      不不不,真的是初三学牲啦
      就当成我的业余爱好吧(用python写各种奇奇怪怪的东西),我只是用GitHub上大佬们写好的程序调调参、训练个模型玩玩,然后稍微琢磨了一下最最最表层的基本原理罢了
      (这玩意对我来说还蛮有意思的)
      不过,之前在B站看到一位高一学生训练的语言模型,效果已经惊艳到我了,现在的高人满地皆是呀

发送评论 编辑评论


				
|´・ω・)ノ
ヾ(≧∇≦*)ゝ
(☆ω☆)
(╯‵□′)╯
 ̄﹃ ̄
(/ω\)
(๑•̀ㅁ•́ฅ)
→_→
୧(๑•̀⌄•́๑)૭
٩(ˊᗜˋ*)و
(ノ°ο°)ノ
(´இ皿இ`)
⌇●﹏●⌇
(ฅ´ω`ฅ)
(╯°A°)╯
φ( ̄∇ ̄o)
ヾ(´・ ・`。)ノ"
( ง ᵒ̌皿ᵒ̌)ง⁼³₌₃
(ó﹏ò。)
Σ(っ °Д °;)っ
(´っω・`。)
( ,,´・ω・)ノ)
╮(╯▽╰)╭
o(*////▽////*)q
>﹏<
( ๑´•ω•)
(ㆆᴗㆆ)
有希酱最可爱啦!(素材来自bilibili@最上川下山)
from魔女的夜宴 (Mimosa整理)
Source: github.com/k4yt3x/flowerhd
整活by Mimosa233
颜文字
周防有希
魔女
小恐龙
花!
夸夸我!