codai · beded066565fd26a9a86dfe9e266b5f0acba1e8c · nexlab / coderai

Add --offload-strategy none to disable CPU offloading and VRAM auto-detection · beded066

Your Name authored Mar 20, 2026

- Add 'none' to --offload-strategy choices in cli.py
- In cuda.py backend:
  - _get_vram_percentages_for_strategy() returns None for 'none' strategy
  - _get_vram_percentages_for_gpu() skips VRAM detection for 'none'
  - load_model() loads directly on GPU without max_memory constraints
- Add startup status message in main.py for --offload-strategy none

beded066

Name	Last commit	Last update
..
api		Loading commit data...
backends		Loading commit data...
models		Loading commit data...
pydantic		Loading commit data...
queue		Loading commit data...
__init__.py		Loading commit data...
cli.py		Loading commit data...
main.py		Loading commit data...
main.py~		Loading commit data...