包含标签:Pytorch 的文章
两百行的图像分类,用CIFAR10训练ResNet18
已阅: 6 水一下这个月的稿子,网上肯定很多,但写都写了就发出来。 # train.py from torch.utils.data import DataLoader from torch.autograd import Variable import torchvision.models as models import torchvision.transforms as T import torch.nn.functional as F import matplotlib.pyplot as plt import numpy as np import torchvision import argparse import random import torch import time import s……MMDet实例分割loss_rpn_bbox为nan但其它loss正常的解决
已阅: 21 昨天还以为这个月无活可整,没想到第二天就来事了,下个月还好久,留到下月发也不大好( º﹃º )。问题描述使用MMDetection训练实例分割,训练可执行,测试可执行,但loss_rpn_bbox为nan,loss_bbox却有值。 评估时,少数模型能获得0.1的精度,但无法随训练次数上升而提高。 使用faster rcnn或mask2former,四个backbone,都出现上述问题。故障原因标签尺寸与图像尺寸不匹配。例如,图像为700x700……MMDet加载旧版本代码权重及自定义数据集的问题及解决
已阅: 17 场景PyTorch说它们2.0很快,那么就安个最新的Torch和MMDet。 打开两年前的顶会文章,复制更早几年的代码文件以及权重。 找个数据集。 按照最新的config进行配置权重路径。 然而,找不到加载权重。解决config 配置# 权重加载为 init_cfg=dict(checkpoint='pretrained/p2t_tiny.pth'),和仓库中其它config一样,区别在于一个是网上链接,一个是本地路径。 model = dict( type='Re……Pytorch因nn.Parameter导致实验不可复现的一种情况
已阅: 34 没解决,只是记录这种情况。 也可以多次实验取均值以避免结果复现。场景自己的模块中,包含一个与x相加的可学习参数,导致单卡同种子下结果无法复现。去掉该模块,能正常复现。 保留声明,注释使用后,能正常复现。且结果与无该模块的结果一致。除了在训练前设定种子外,我还在模块内部再次设置了种子,但依然无效。相关代码 def __init__(self): self.pos = torch.nn.Parameter(torch.zer……邪道方法-字典转字符串以传参字典给多GPU训练的mmseg
已阅: 3 引言我想把字典传参给多GPU训练,但一直报错,各种类型的报错。 于是我试着将字典转为字符串形式,在模型内部解析为字典,可行。 我懒得把代码从服务器上搞过来了,所以这里只给截图,反正大家也用不到我的参数,思路用到的代码也不多。 还有其它的解决方法,比如一个个传,不用字典形式,但是很丑,我不喜欢。 也可以通过临时文件作为中转,传参就传个文件目录解决方法对于下面给定的字典,我想把它……
(◕ܫ◕)
评论于 MMDet实例分割loss_rpn_bbox为nan但其它loss正常的解决