elasticsearch-py/docs/examples/10c3fe2265bb34964bd1005f9da66773.asciidoc at 6f05858c344d1b5b925c047c86001b0e9355bcde · elastic/elasticsearch-py · GitHub

resp = client.inference.put_model(
    task_type="text_embedding",
    inference_id="my-msmarco-minilm-model",
    body={
        "service": "elasticsearch",
        "service_settings": {
            "num_allocations": 1,
            "num_threads": 1,
            "model_id": "msmarco-MiniLM-L12-cos-v5",
        },
    },
)
print(resp)