reasoning-models

Here are 27 public repositories matching this topic...

zilliztech / deep-searcher

Open Source Deep Research Alternative to Reason and Search on Private Data. Written in Python.

agent openai grok claude rag milvus vector-database llm zilliz deepseek agentic-rag grok3 reasoning-models deepseek-r1 deep-research qwen3 llama4

Updated May 24, 2025
Python

UCSC-VLAA / MedReason

Star

MedReason: Eliciting Factual Medical Reasoning Steps in LLMs via Knowledge Graphs

reasoning medical-dataset medical-large-language-models reasoning-models

Updated Apr 8, 2025
Python

hao-ai-lab / Dynasor

Star

Simple extension on vLLM to help you speed up reasoning model without training.

llm reasoning-models deepseek-r1

Updated May 3, 2025
Python

IAAR-Shanghai / xVerify

Star

xVerify: Efficient Answer Verifier for Reasoning Model Evaluations

benchmark regex reliability evaluation llm reliability-tools chatgpt cc-by-nc-nd-4 open-compass llm-as-a-judge deepseek-math judge-model reasoning-models open-r1 xverify math-verify

Updated Apr 17, 2025
Python

codelion / pts

Star

Pivotal Token Search

Updated May 17 10000 , 2025
Python

eric-ai-lab / Soft-Thinking

Star

Official implementation of the paper "Soft Thinking: Unlocking the Reasoning Potential of LLMs in Continuous Concept Space"

soft-reasoning chain-of-thought-reasoning reasoning-models soft-thinking continous-space-reasoning soft-token concept-token

Updated May 28, 2025
Python

DolbyUUU / Logic-RL-Lite

Star

Lightweight replication study of DeepSeek-R1-Zero. Interesting findings include "No Aha Moment", "Longer CoT ≠ Accuracy", and "Language Mixing in Instruct Models".

reinforcement-learning fine-tuning post-training llm deepseek gpt-o1 reasoning-language-models reasoning-models deepseek-r1

Updated Apr 1, 2025
Python

czg1225 / VeriThinker

Star

VeriThinker: Learning to Verify Makes Reasoning Model Efficient

efficiency fine-tuning large-language-models reasoning-models deepseek-r1-distill-llama deepseek-r1-distill-qwen

Updated May 29, 2025
Python

DolbyUUU / DeepEnlighten

Star

Pure RL to post-train base models for social reasoning capabilities. Lightweight replication of DeepSeek-R1-Zero with Social IQa dataset.

reinforcement-learning fine-tuning post-training llm deepseek gpt-o1 reasoning-language-models reasoning-models deepseek-r1

Updated Mar 16, 2025
Python

UKPLab / acl2025-diverse-cot

Star

Code for the 2025 ACL publication "Fine-Tuning on Diverse Reasoning Chains Drives Within-Inference CoT Refinement in LLMs"

cot lrm chain-of-thought large-reasoning-models reasoning-models

Updated Jul 4, 2024
Python

fscdc / ReasonMap

Star

[arXiv 2025] Can MLLMs Guide Me Home? A Benchmark Study on Fine-Grained Visual Reasoning from Transit Maps

reasoning multimodal-large-language-models reasoning-models efficient-reasoning

Updated May 16, 2025
Python

microsoft / BUILD25-LAB333

Star

This repository hosts the instructions and workshop materials for Lab 333 - Evaluate Reasoning Models for Your Generative AI Solutions

python openai model-catalog azure-ai-foundry reasoning-models

Updated May 21, 2025
Jupyter Notebook

mrorigo / agentic-deep-graph-reasoning

Star

Agentic Deep Graph Reasoning Implementation

knowledge-graph knowledge-distillation entity-extraction ai-learning reasoning-models

Updated Mar 4, 2025
Python

AbhaySingh71 / AI-Lawyer-RAG-with-Deepseek

Star

AI Lawyer is an intelligent reasoning legal assistant powered by DeepSeek , Ollama RAG and LangChain, designed to streamline legal research and document analysis. By leveraging retrieval-augmented generation (RAG), it provides precise legal insights, and contract summarization. With an intuitive Streamlit-based UI, analyze legal documents.

chatbot huggingface streamlit vector-database legal-analytics-and-data-science generative-ai langchain llm-agent retrieval-augmented-generation ollama faiss-vector-database groqapi ollamaembeddings reasoning-models deepseek-r1

Updated May 4, 2025
Python

sshh12 / state-sandbox

Star

State Sandbox is an experimental game for socioeconomic simulation. It uses Large Language Models (o3-mini) to simulate the world and complex policy impacts.

civilization ai-games o1 socioeconomics nation-states reasoning-models o3-mini

Updated Feb 4, 2025
JavaScript

DolbyUUU / Sudoku4LLM

Star

Sudoku4LLM is a Sudoku dataset generator for training and evaluating reasoning in Large Language Models (LLMs). It offers customizable puzzles, difficulty levels, and 11 serialization formats to support structured data reasoning and Chain of Thought (CoT) experiments.

reinforcement-learning fine-tuning post-training dataset-generator llm rl-for-finance reasoning-language-models reasoning-models deepseek-r1 rl-for-llm