Tinh chỉnh mô hình ngôn ngữ lớn tiếng Việt cho một số tác vụ xử lý ngôn ngữ tự nhiên.

1. Mục tiêu

Tìm hiểu, so sánh 2 kỹ thuật tinh chỉnh phổ biến trong thời điểm hiện tại:
- Tinh chỉnh toàn phần (full fine-tune - FFT)
- LoRA (Low-Rank Adaptation of Large Language Models)
Sử dụng nhiều GPUs để hỗ trợ tinh chỉnh các mô hình ngôn ngữ lớn đồng thời
Tinh chỉnh mô hình ngôn ngữ lớn cho 2 tác vụ xử lý ngôn ngữ tự nhiên
- Phân tích cảm xúc (Sentiment Analysis - SA)
- Nhận dạng thực thể có tên (Named Entity Recognition - NER)

2. Datasets

3. Các mô hình ngôn ngữ lớn cho tiếng Việt

4. Fine-tuning Techniques

Full Model Fine-tuning
LoRA (Low-Rank Adaptation)

5. Cài đặt các gói phụ thuộc

Pytorch
Jupyter Notebook (Nếu cần)
Cài đặt Transformer phiên bản mới nhất cho bài toán SA trên tập UIT-VSFC (để chạy ViT5 cho bài toán SequenceClassification)
Cài đặt Transformer phiên bản có thể sử dụng Fast text cho PhoBERT theo hướng dẫn tại Repo PhoBERT để chạy bài toán NER

pip install pandas
pip install datasets adapters peft bitsandbytes
pip install lightning torchmetrics
pip install underthesea
pip install matplotlib seaborn
pip install peft==0.5.0

Name		Name	Last commit message	Last commit date
Latest commit History 4 Commits
data		data
mint		mint
.gitignore		.gitignore
README.md		README.md
phoner_fft.py		phoner_fft.py
phoner_lora.py		phoner_lora.py
setup.py		setup.py
vsfc_fft.py		vsfc_fft.py
vsfc_lora.py		vsfc_lora.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

Tinh chỉnh mô hình ngôn ngữ lớn tiếng Việt cho một số tác vụ xử lý ngôn ngữ tự nhiên.

1. Mục tiêu

2. Datasets

3. Các mô hình ngôn ngữ lớn cho tiếng Việt

4. Fine-tuning Techniques

5. Cài đặt các gói phụ thuộc

About

Uh oh!

Uh oh!

Languages

hoadm-net/FTVPLM

Folders and files

Latest commit

History

Repository files navigation

Tinh chỉnh mô hình ngôn ngữ lớn tiếng Việt cho một số tác vụ xử lý ngôn ngữ tự nhiên.

1. Mục tiêu

2. Datasets

3. Các mô hình ngôn ngữ lớn cho tiếng Việt

4. Fine-tuning Techniques

5. Cài đặt các gói phụ thuộc

About

Topics

Resources

Uh oh!

Stars

Watchers

Forks

Uh oh!

Languages