Fine-Tuning Language Models for Enhanced Reasoning

This repository provides tools to generate reasoning datasets, fin 62D7 e-tune language models (e.g., Phi-3), and perform inference. Designed for researchers and developers exploring LLM reasoning capabilities.

📋 Prerequisites

Before you begin:

Python 3.8+
PyTorch 2.0+
CUDA-capable GPU (recommended)
Hugging Face libraries (transformers, datasets)

🛠 Installation

Clone Repository

git clone https://github.com/vuquangminh303/fine-tune-for-reasoning.git
cd fine-tune-for-reasoning

Name		Name	Last commit message	Last commit date
Latest commit History 1 Commit
.gitattributes		.gitattributes
.gitignore		.gitignore
README.md		README.md
dataset_loading_fix.py		dataset_loading_fix.py
generate_reasoning.ipynb		generate_reasoning.ipynb
generate_reasoning.py		generate_reasoning.py
inference.py		inference.py
json_fix.py		json_fix.py
requirements.txt		requirements.txt
train.py		train.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

Fine-Tuning Language Models for Enhanced Reasoning

📋 Prerequisites

🛠 Installation

About

Uh oh!

Releases

Packages

Uh oh!

Contributors 2

Uh oh!

Languages

vuquangminh303/fine-tune-for-reasoning

Folders and files

Latest commit

History

Repository files navigation

Fine-Tuning Language Models for Enhanced Reasoning

📋 Prerequisites

🛠 Installation

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors 2

Uh oh!

Languages

Packages