limcheekin · limcheekin · Sep 27, 2023 · Sep 22, 2023 · Sep 22, 2023 · Sep 22, 2023
diff --git a/open/text/embeddings/server/__main__.py b/open/text/embeddings/server/__main__.py
@@ -17,9 +17,10 @@
 """
 import uvicorn
 import os
-from open.text.embeddings.server.app import create_app
+from open.text.embeddings.server.app import create_app, initialize_embeddings
 
 if __name__ == "__main__":
+    initialize_embeddings()
     app = create_app()
 
     uvicorn.run(

diff --git a/open/text/embeddings/server/app.py b/open/text/embeddings/server/app.py
@@ -8,6 +8,7 @@
 from langchain.embeddings import HuggingFaceInstructEmbeddings
 from langchain.embeddings import HuggingFaceBgeEmbeddings
 import os
+import torch
 
 router = APIRouter()
 
@@ -62,39 +63,48 @@ class CreateEmbeddingResponse(BaseModel):
 
 embeddings = None
 
-
-def _create_embedding(
-    model: Optional[str],
-    input: Union[str, List[str]]
-):
+def initialize_embeddings(model: Optional[str] = None):
-def initialize_embeddings(model: Optional[str] = None):
+def initialize_embeddings():
-def initialize_embeddings(model: Optional[str] = None):
+def initialize_embeddings():
     global embeddings
 
-    if embeddings is None:
-        if model and model != "text-embedding-ada-002":
-            model_name = model
-        else:
-            model_name = os.environ["MODEL"]
-        print("Loading model:", model_name)
-        encode_kwargs = {
-            "normalize_embeddings": bool(os.environ.get("NORMALIZE_EMBEDDINGS", ""))
-        }
-        print("encode_kwargs", encode_kwargs)
-        if "e5" in model_name:
-            embeddings = HuggingFaceInstructEmbeddings(model_name=model_name,
-                                                       embed_instruction=E5_EMBED_INSTRUCTION,
-                                                       query_instruction=E5_QUERY_INSTRUCTION,
-                                                       encode_kwargs=encode_kwargs)
-        elif model_name.startswith("BAAI/bge-") and model_name.endswith("-en"):
-            embeddings = HuggingFaceBgeEmbeddings(model_name=model_name,
-                                                  query_instruction=BGE_EN_QUERY_INSTRUCTION,
-                                                  encode_kwargs=encode_kwargs)
-        elif model_name.startswith("BAAI/bge-") and model_name.endswith("-zh"):
-            embeddings = HuggingFaceBgeEmbeddings(model_name=model_name,
-                                                  query_instruction=BGE_ZH_QUERY_INSTRUCTION,
-                                                  encode_kwargs=encode_kwargs)
-        else:
-            embeddings = HuggingFaceEmbeddings(
-                model_name=model_name, encode_kwargs=encode_kwargs)
+    if "DEVICE" in os.environ:
+        device = os.environ["DEVICE"]
+    else:
+        device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
+    print("Using device:", device)
+
+    if model and model != "text-embedding-ada-002":
+        model_name = model
+    else:
+        model_name = os.environ["MODEL"]
+    print("Loading model:", model_name)
+    encode_kwargs = {
+        "normalize_embeddings": bool(os.environ.get("NORMALIZE_EMBEDDINGS", ""))
+    }
+    print("encode_kwargs", encode_kwargs)
+    if "e5" in model_name:
+        embeddings = HuggingFaceInstructEmbeddings(model_name=model_name,
+                                                    embed_instruction=E5_EMBED_INSTRUCTION,
+                                                    query_instruction=E5_QUERY_INSTRUCTION,
+                                                    encode_kwargs=encode_kwargs,
+                                                    model_kwargs={"device": device})
+    elif model_name.startswith("BAAI/bge-") and model_name.endswith("-en"):
+        embeddings = HuggingFaceBgeEmbeddings(model_name=model_name,
+                                                query_instruction=BGE_EN_QUERY_INSTRUCTION,
+                                                encode_kwargs=encode_kwargs,
+                                                model_kwargs={"device": device})
+    elif model_name.startswith("BAAI/bge-") and model_name.endswith("-zh"):
+        embeddings = HuggingFaceBgeEmbeddings(model_name=model_name,
+                                                query_instruction=BGE_ZH_QUERY_INSTRUCTION,
+                                                encode_kwargs=encode_kwargs,
+                                                model_kwargs={"device": device})
+    else:
+        embeddings = HuggingFaceEmbeddings(model_name=model_name,
+                                            encode_kwargs=encode_kwargs,
+                                            model_kwargs={"device": device})
+
+
+def _create_embedding(input: Union[str, List[str]]):
+    global embeddings
 
     if isinstance(input, str):
         return CreateEmbeddingResponse(data=[Embedding(embedding=embeddings.embed_query(input))])
@@ -112,5 +122,5 @@ async def create_embedding(
     request: CreateEmbeddingRequest
 ):
     return await run_in_threadpool(
-        _create_embedding, **request.dict(exclude={"user"})
+        _create_embedding, **request.dict(exclude={"user", "model", "model_config"})
     )