Skip to content

双系统的训练 #262

@markAKB

Description

@markAKB

在训练时使用了traj_images提取到的特征,进行噪声的预测。而加噪轨迹基于traj_poses,两者在时间上是一一对应的。请问我的理解有问题吗?如果是这样,是不是会训练中会出现未来帧的信息泄露的问题?

以下是我阅读到的训练时forward和dataset加载的代码:

latents = torch.cat([memory_tokens, traj_hidden_states], dim=1)

traj_poses_gt.append(torch.tensor(rel_pose_resample))

Metadata

Metadata

Assignees

Labels

No labels
No labels

Type

No type

Projects

No projects

Milestone

No milestone

Relationships

None yet

Development

No branches or pull requests

Issue actions