MNBVC(Massive Never-ending BT Vast Chinese corpus)超大规模中文语料集。对标chatGPT训练的40T数据。MNBVC数据集不但包括主流文化，也包括各个小众文化甚至火星文的数据。MNBVC数据集包括新闻、作文、小说、书籍、杂志、论文、台词、帖子、wiki、古诗、歌词、商品介绍、笑话、糗事、聊天记录等一切形式的纯文本中文数据。

3,878 275 Updated Jun 9, 2025

langchain-ai / langchain

🦜🔗 Build context-aware reasoning applications

Jupyter Notebook 109,364 17,793 Updated Jun 13, 2025

hongbinye / Cognitive-Mirage-Hallucinations-in-LLMs

Repository for the paper "Cognitive Mirage: A Review of Hallucinations in Large Language Models"

47 1 Updated Oct 21, 2023

THUDM / LongBench

LongBench v2 and LongBench (ACL 2024)

Python 895 88 Updated Jan 15, 2025

yangjianxin1 / LongQLoRA

LongQLoRA: Extent Context Length of LLMs Efficiently

Python 166 15 Updated Nov 12, 2023

CLUEbenchmark / SuperCLUE

SuperCLUE: 中文通用大模型综合性基准 | A Benchmark for Foundation Models in Chinese

3,198 107 Updated Apr 28, 2025

LlamaFamily / Llama-Chinese

Llama中文社区，实时汇总最新Llama学习资料，构建最好的中文Llama大模型开源生态，完全开源可商用

Python 14,608 1,304 Updated Apr 6, 2025

hiyouga / LLaMA-Factory

Unified Efficient Fine-Tuning of 100+ LLMs & VLMs (ACL 2024)

Python 52,204 6,300 Updated Jun 12, 2025

baichuan-inc / Baichuan2

A series of large language models developed by Baichuan Intelligent Technology

Python 4,123 295 Updated Nov 8, 2024

elastic / elasticsearch

Free and Open Source, Distributed, RESTful Search Engine

Java 72,939 25,254 Updated Jun 13, 2025

LianjiaTech / BELLE

BELLE: Be Everyone's Large Language model Engine（开源中文对话大模型）

HTML 8,169 767 Updated Oct 16, 2024

VITA-MLLM / Woodpecker

✨✨Woodpecker: Hallucination Correction for Multimodal Large Language Models

Python 637 30 Updated Dec 23, 2024

gaomingqi / Track-Anything

Track-Anything is a flexible and interactive tool for video object tracking and segmentation, based on Segment Anything, XMem, and E2FGVI.

Python 6,731 497 Updated May 31, 2024

jiawen-zhu / HQTrack

Tracking Anything in High Quality

Python 752 62 Updated Dec 1, 2023

ShoufaChen / DiffusionDet

[ICCV2023 Best Paper Finalist] PyTorch implementation of DiffusionDet (https://arxiv.org/abs/2211.09788)

Python 2,182 167 Updated Dec 22, 2022

noahcao / OC_SORT

[CVPR2023] The official repo for OC-SORT: Observation-Centric SORT on video Multi-Object Tracking. OC-SORT is simple, online and robust to occlusion/non-linear motion.

Python 897 124 Updated Jul 18, 2023

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

rongzhimd

Block or report rongzhimd

Stars

VITA-MLLM / VITA-Audio

BradyFU / Awesome-Multimodal-Large-Language-Models

TideDra / lmm-r1

OpenManus / OpenManus-RL

om-ai-lab / VLM-R1

EvolvingLMMs-Lab / open-r1-multimodal

Wang-Xiaodong1899 / Open-R1-Video

Qihoo360 / 360-LLaMA-Factory

open-compass / VLMEvalKit

MME-Benchmarks / Video-MME

zhourax / VEGA

YifanXu74 / MQ-Det

shenyunhang / APE

DSXiangLi / DecryptPrompt

esbatmop / MNBVC