Spaces:

CGIAR
/

farmerbot

Sleeping

App Files Files Community

farmerbot / fine_tune_file /llama_finetune.py

Nelly43

Update app

0c6d13f 23 days ago

raw

history blame contribute delete

5.69 kB

	import os
	import torch
	from datasets import load_dataset, Dataset
	import pandas as pd
	import transformers
	from transformers import AutoTokenizer, AutoModelForCausalLM, BitsAndBytesConfig
	from trl import SFTTrainer
	import transformers
	# from peft import AutoPeftModelForCausalLM
	from transformers import GenerationConfig
	from pynvml import *
	import glob
	class llama_trainer:
	def llama_model(self,lr,epoch,batch_size,gradient_accumulation,quantization,lora_r,lora_alpha,lora_dropout):
	# base_model = "NousResearch/Llama-2-7b-chat-hf"
	base_model="NousResearch/Meta-Llama-3-8B"
	# base_model="unsloth/Meta-Llama-3.1-8B-Instruct"
	from datetime import datetime
	lora_output = f'models/{quantization}_Llama_lora_{datetime.now().strftime("%Y_%m_%d_%H_%M_%S")}'
	full_output = f'models/{quantization}_Llama_full_{datetime.now().strftime("%Y_%m_%d_%H_%M_%S")}'
	DEVICE = 'cuda'

	# set quantization config
	bnb_config = BitsAndBytesConfig(
	load_in_8bit= True,
	)
	if quantization == 4:
	bnb_config = BitsAndBytesConfig(
	load_in_4bit= True,
	bnb_4bit_use_double_quant=True,
	bnb_4bit_quant_type="nf4",
	bnb_4bit_compute_dtype=torch.bfloat16
	)
	model = AutoModelForCausalLM.from_pretrained(
	base_model,
	quantization_config=bnb_config,
	torch_dtype=torch.bfloat16,
	device_map="auto",
	trust_remote_code=True,
	)
	model.config.use_cache = False # silence the warnings
	model.config.pretraining_tp = 1
	model.gradient_checkpointing_enable()

	tokenizer = AutoTokenizer.from_pretrained(base_model, trust_remote_code=True)
	tokenizer.padding_side = 'right'
	tokenizer.pad_token = tokenizer.eos_token
	tokenizer.add_eos_token = True
	tokenizer.add_eos_token

	data_location = r"data/finetune_data.xlsx" ## replace here
	data_df=pd.read_excel( data_location )

	for i in range(len(data_df)):

	data_df.loc[i,'Text']="### Instruction:"+str(data_df.loc[i,'question'])+"### Response:"+str(data_df.loc[i,'answer'])

	dataset = Dataset.from_pandas(data_df)

	# Set PEFT adapter config (16:32)
	from peft import LoraConfig, get_peft_model, prepare_model_for_kbit_training

	config = LoraConfig(
	r= lora_r if lora_r else 16,
	lora_alpha= lora_alpha if lora_alpha else 32,
	target_modules=["q_proj", "v_proj","k_proj","o_proj","gate_proj","up_proj","down_proj"], # target all the linear layers for full finetuning
	lora_dropout= lora_dropout if lora_dropout else 0.05,
	bias="none",
	task_type="CAUSAL_LM")

	# stabilize output layer and layernorms
	model = prepare_model_for_kbit_training(model)
	# Set PEFT adapter on model (Last step)
	model = get_peft_model(model, config)

	# Set Hyperparameters
	MAXLEN=512
	BATCH_SIZE = batch_size if batch_size else 4
	GRAD_ACC = gradient_accumulation if gradient_accumulation else 4
	OPTIMIZER ='paged_adamw_8bit' # save memory
	LR=lr if lr else 5e-06 # slightly smaller than pretraining lr \| and close to LoRA standard

	# Set training config
	training_config = transformers.TrainingArguments(per_device_train_batch_size=BATCH_SIZE,
	gradient_accumulation_steps=GRAD_ACC,
	optim=OPTIMIZER,
	learning_rate=LR,
	fp16=True, # consider compatibility when using bf16
	logging_steps=10,
	num_train_epochs = epoch if epoch else 2,
	output_dir=lora_output,
	remove_unused_columns=True,

	)

	# Set collator
	data_collator = transformers.DataCollatorForLanguageModeling(tokenizer,mlm=False)

	# Setup trainer
	trainer = SFTTrainer(model=model,
	train_dataset=dataset,
	data_collator=data_collator,
	args=training_config,
	dataset_text_field="Text",
	# callbacks=[early_stop], need to learn, lora easily overfits
	)

	trainer.train()

	trainer.save_model(lora_output)


	# Get peft config
	from peft import PeftConfig
	config = PeftConfig.from_pretrained(lora_output)

	model = transformers.AutoModelForCausalLM.from_pretrained(config.base_model_name_or_path)

	# Load the Lora model
	from peft import PeftModel
	model = PeftModel.from_pretrained(model, lora_output)

	# Get tokenizer
	tokenizer = transformers.AutoTokenizer.from_pretrained(config.base_model_name_or_path)
	merged_model = model.merge_and_unload()

	merged_model.save_pretrained(full_output)
	tokenizer.save_pretrained(full_output)
	print(""10,": Model is saved!!!")


	lm=llama_trainer()
	lm.llama_model(5e-6,2,4,4,8,16,32,.05)