llama-stack-mirror

mirror of https://github.com/meta-llama/llama-stack.git synced 2025-12-03 09:53:45 +00:00

History

Charlie Doern 7574f147b6 feat: implement OpenAI chat completion for meta_reference provider - Add chat_completion() method to LlamaGenerator supporting OpenAI request format - Implement openai_chat_completion() in MetaReferenceInferenceImpl - Fix ModelRunner task dispatch to handle chat_completion tasks - Add convert_openai_message_to_raw_message() utility for message conversion - Add unit tests for message conversion and model-parallel dispatch - Remove unused CompletionRequestWithRawContent references Signed-off-by: Charlie Doern <cdoern@redhat.com>	2025-11-08 14:33:19 -05:00
..
__init__.py	feat: implement OpenAI chat completion for meta_reference provider	2025-11-08 14:33:19 -05:00
test_meta_reference.py	feat: implement OpenAI chat completion for meta_reference provider	2025-11-08 14:33:19 -05:00

Charlie Doern 7574f147b6 feat: implement OpenAI chat completion for meta_reference provider

- Add chat_completion() method to LlamaGenerator supporting OpenAI request format
- Implement openai_chat_completion() in MetaReferenceInferenceImpl
- Fix ModelRunner task dispatch to handle chat_completion tasks
- Add convert_openai_message_to_raw_message() utility for message conversion
- Add unit tests for message conversion and model-parallel dispatch
- Remove unused CompletionRequestWithRawContent references

Signed-off-by: Charlie Doern <cdoern@redhat.com>

2025-11-08 14:33:19 -05:00

__init__.py

feat: implement OpenAI chat completion for meta_reference provider

2025-11-08 14:33:19 -05:00

test_meta_reference.py

feat: implement OpenAI chat completion for meta_reference provider

2025-11-08 14:33:19 -05:00