litellm_fix/LIT-3313-streaming-chunk-overhead - Branch - BerriAI/litellm

perf(streaming): cut per-chunk overhead ~30% on Anthropic + Bedrock hot path

#28720Merged

Comparing

litellm_fix/LIT-3313-streaming-chunk-overhead

(

e8bf753

) with

litellm_internal_staging

(

35f6961

)

Untouched: 16

Benchmarks

16 total

test_get_model_info_with_provider

tests/benchmarks/test_benchmarks.py

-1%

79.8 µs81 µs

test_get_model_info_anthropic

tests/benchmarks/test_benchmarks.py

+1%

80.9 µs80 µs

test_get_llm_provider_openai

tests/benchmarks/test_benchmarks.py

-1%

138 µs139.4 µs

test_token_counter_long_content

tests/benchmarks/test_benchmarks.py

-1%

1.7 ms1.7 ms

test_token_counter_simple_message

tests/benchmarks/test_benchmarks.py

+1%

236.7 µs235.1 µs

test_cost_per_token_openai

tests/benchmarks/test_benchmarks.py

554.8 µs556.7 µs

test_get_model_cost_key_case_insensitive

tests/benchmarks/test_benchmarks.py

82.2 µs82 µs

test_token_counter_with_tools

tests/benchmarks/test_benchmarks.py

413.7 µs412.6 µs

test_token_counter_raw_text

tests/benchmarks/test_benchmarks.py

183.9 µs183.5 µs

test_cost_per_token_anthropic

tests/benchmarks/test_benchmarks.py

556.5 µs557.8 µs

test_token_counter_multi_turn

tests/benchmarks/test_benchmarks.py

566.9 µs567.7 µs

test_get_model_info_openai

tests/benchmarks/test_benchmarks.py

81.9 µs81.7 µs

test_get_llm_provider_with_prefix

tests/benchmarks/test_benchmarks.py

136.9 µs137 µs

test_get_llm_provider_anthropic

tests/benchmarks/test_benchmarks.py

142.5 µs142.5 µs

test_get_model_cost_key_exact_match

tests/benchmarks/test_benchmarks.py

79.9 µs79.9 µs

test_get_llm_provider_azure

tests/benchmarks/test_benchmarks.py

144.2 µs144.2 µs

Commits

Click on a commit to change the comparison range

Base

main

35f6961

+56.72%

chore: update uv.lock after dependency resolution

42edc8c

25 days ago

by claude

-56.81%

fix(ci): restore uv.lock generated by uv 0.10.9 for lint compatibility

e8bf753

25 days ago

by claude

Home Terms Privacy Docs