LLMs Architecture

This repository contains implementations of LLMs

Implemented Architectures

GPT2
BERT
Llama

📚 Description

This repository is structured as follows:

Data Folder contains small text files for simple training
GPT2 Folder contains training, model, textsampler
BERT Folder contains Bert Model and Bert Modules
Llama Folder contains Llama Model with GQA and RoPE Modules

🚀 Goals

Implement and experiment with different model architecture.
Develop foundational components for future research in transformers.
Provide clean and modular code.

📝 Research Papers Implemented (or To Be Implemented)

GPT2 Paper (https://paperswithcode.com/paper/language-models-are-unsupervised-multitask)
Bert Paper (https://arxiv.org/abs/1810.04805)
Llama Paper (https://arxiv.org/abs/2307.09288)

💡 Future Work

Implement more LLMs architectures.

⭐ Contributions

Feel free to contribute to this repository or suggest improvements.

Name		Name	Last commit message	Last commit date
Latest commit History 12 Commits
Bert		Bert
GPT2		GPT2
Llama		Llama
Mistral		Mistral
Moe		Moe
data		data
images		images
Readme.md		Readme.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

LLMs Architecture

This repository contains implementations of LLMs

📚 Description

🚀 Goals

📝 Research Papers Implemented (or To Be Implemented)

💡 Future Work

⭐ Contributions

About

Releases

Packages

Languages

eramax/LLMs

Folders and files

Latest commit

History

Repository files navigation

LLMs Architecture

This repository contains implementations of LLMs

📚 Description

🚀 Goals

📝 Research Papers Implemented (or To Be Implemented)

💡 Future Work

⭐ Contributions

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages