Adding support for Meta-LLama-3.1-8B-Instruct. by Preetika764 · Pull Request #15 · IST-DASLab/PanzaMail

Preetika764 · 2024-08-03T11:14:50Z

Adding support for Meta-LLama-3.1-8B-Instruct. I tried finetuning the model on NVIDIA L4 GPU in 4bits. I was getting OOM errors for bf16 and fp32. To prepare the dataset, run ./prepare_dataset.sh LOAD_IN_4BIT=1 RUN_FP32=1. To finetune, run !./train_rosa.sh CONFIG=../src/panza/finetuning/configs/llama3.1_4bit_rosa_panza.yaml.

Preetika764 added 2 commits August 3, 2024 11:03

Adding support for Meta-Llama-3.1-8B-Instruct

1265e77

Adding support for Meta-Llama-3.1-8B-Instruct

fe38250

Preetika764 requested review from ArmandNM and dalistarh August 3, 2024 11:16

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Adding support for Meta-LLama-3.1-8B-Instruct.#15

Adding support for Meta-LLama-3.1-8B-Instruct.#15
Preetika764 wants to merge 2 commits intoIST-DASLab:mainfrom
Preetika764:llama3.1

Preetika764 commented Aug 3, 2024

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

1 participant

Conversation

Preetika764 commented Aug 3, 2024

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

1 participant