[BUG] model(**input) cannot use under zero stage 3. #6949

MarkDeng1 · 2025-01-14T22:56:26Z

Describe the bug
I would like to train a llava model using RL.
after model loaded via :

model = LlavaLlamaForCausalLM.from_pretrained(...)

I also want to have another model called ref_model:

ref0_model = copy.deepcopy(model)

then i use trainer:
trainer = LLaVATrainer(model=model,
ref_model = ref_model,
rl_mode = True,
tokenizer=tokenizer,
args=training_args,
**data_module)
use trainer.train().

In trainer.train():
i need to get output from self.model(**batch), this is successful.
But i also need to get output_ref from self.ref0_model(**batch), this is unsuccessful.

Bug report: the dimension is incorrect when forward()...

However, we use same model as ref0_model deepcopy from model.
How do i solve this under stage 3?

MarkDeng1 added bug Something isn't working training labels Jan 14, 2025

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

[BUG] model(**input) cannot use under zero stage 3. #6949

[BUG] model(**input) cannot use under zero stage 3. #6949

MarkDeng1 commented Jan 14, 2025 •

edited

Loading

[BUG] model(**input) cannot use under zero stage 3. #6949

[BUG] model(**input) cannot use under zero stage 3. #6949

Comments

MarkDeng1 commented Jan 14, 2025 • edited Loading

MarkDeng1 commented Jan 14, 2025 •

edited

Loading