LLM_practice

A collection of demo scripts for interacting with large language models through various providers and serving frameworks.

Demos

File	Description
`src/openai_demo.py`	OpenAI API — sync, streaming, async, async streaming
`src/claude_demo.py`	Anthropic Claude API
`src/litellm_demo.py`	LiteLLM unified interface across multiple providers
`src/bedrock_demo.py`	AWS Bedrock
`src/vllm_demo.py`	vLLM — offline batch inference + OpenAI-compatible server

vLLM demo quick start

Install vLLM and start the server:

pip install vllm
vllm serve Qwen/Qwen2.5-1.5B-Instruct --port 8000

Run the demo:

# uses http://localhost:8000 and Qwen/Qwen2.5-1.5B-Instruct by default
python src/vllm_demo.py

# or override via environment variables
VLLM_BASE_URL=http://localhost:8000/v1 VLLM_MODEL=meta-llama/Llama-3.2-1B-Instruct python src/vllm_demo.py

Name		Name	Last commit message	Last commit date
Latest commit History 7 Commits
.opencode		.opencode
openspec		openspec
src		src
.gitignore		.gitignore
README.md		README.md
poetry.lock		poetry.lock
pyproject.toml		pyproject.toml

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

LLM_practice

Demos

vLLM demo quick start

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

LLM_practice

Demos

vLLM demo quick start

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages