GitHub - kids/vllm: updates for model-name checking and stop tokens

vLLM

Easy, fast, and cheap LLM serving for everyone

针对本地部署的模型，一般单机只部署单个模型，为了统一下游负载均衡的调用，更新了调用时模型名的校验机制；同时将<|im_end|>,<|im_start|>作为默认的stop token

本地启动的模型一般以路径为模型名，调用时需要对齐比如:

python -m vllm.entrypoints.openai.api_server --model /path/some-merged-gpt --trust-remote-code

那么请求

requests.post('http://serv-url.com/v1/chat/completions',json={
            "model": "/path/some-merged-gpt",
            "messages": [{"role": "user", "content": "hello"}]
        },headers={"Content_Type": "application/json"})

中model的参数就必须暴露启动时的路径因此在只有一个模型serving的场景下，bypass了模型名校验，可以使用任意名称作为model参数调用 modifications are in vllm/entrypoints/openai/serving_engine.py

add <|im_end|>,<|im_start|> as default stop tokens in: /vllm/entrypoints/openai/protocol.py

Name		Name	Last commit message	Last commit date
Latest commit History 997 Commits
.buildkite		.buildkite
.github		.github
benchmarks		benchmarks
cmake		cmake
csrc		csrc
docs		docs
examples		examples
rocm_patch		rocm_patch
tests		tests
vllm		vllm
.dockerignore		.dockerignore
.gitignore		.gitignore
.readthedocs.yaml		.readthedocs.yaml
.yapfignore		.yapfignore
CMakeLists.txt		CMakeLists.txt
CONTRIBUTING.md		CONTRIBUTING.md
Dockerfile		Dockerfile
Dockerfile.rocm		Dockerfile.rocm
LICENSE		LICENSE
MANIFEST.in		MANIFEST.in
README.md		README.md
collect_env.py		collect_env.py
format.sh		format.sh
patch_xformers.rocm.sh		patch_xformers.rocm.sh
pyproject.toml		pyproject.toml
requirements-build.txt		requirements-build.txt
requirements-dev.txt		requirements-dev.txt
requirements-neuron.txt		requirements-neuron.txt
requirements-rocm.txt		requirements-rocm.txt
requirements.txt		requirements.txt
setup.py		setup.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

Easy, fast, and cheap LLM serving for everyone

About

Uh oh!

Releases

Packages

Languages

License

kids/vllm

Folders and files

Latest commit

History

Repository files navigation

Easy, fast, and cheap LLM serving for everyone

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages