griptape-ai
diff --git a/‎griptape/drivers/embedding/azure_openai_embedding_driver.py
+13-2 b/‎griptape/drivers/embedding/azure_openai_embedding_driver.py
+13-2
diff --git a/‎griptape/drivers/embedding/openai_embedding_driver.py
+21-32 b/‎griptape/drivers/embedding/openai_embedding_driver.py
+21-32
diff --git a/‎griptape/drivers/prompt/azure_openai_chat_prompt_driver.py
+49-10 b/‎griptape/drivers/prompt/azure_openai_chat_prompt_driver.py
+49-10
diff --git a/‎griptape/drivers/prompt/azure_openai_completion_prompt_driver.py
+16-15 b/‎griptape/drivers/prompt/azure_openai_completion_prompt_driver.py
+16-15
diff --git a/‎griptape/drivers/prompt/base_prompt_driver.py
+1-1 b/‎griptape/drivers/prompt/base_prompt_driver.py
+1-1
@@ -3,6 +3,7 @@
 from attr import define, field, Factory
 from griptape.drivers import OpenAiEmbeddingDriver
 from griptape.tokenizers import OpenAiTokenizer
+import openai
 
 
 @define
@@ -17,7 +18,6 @@ class AzureOpenAiEmbeddingDriver(OpenAiEmbeddingDriver):
         tokenizer: Optionally provide custom `OpenAiTokenizer`.
     """
 
-    model: str = field(kw_only=True)
     deployment_id: str = field(kw_only=True)
     api_base: str = field(kw_only=True)
     api_type: str = field(default="azure", kw_only=True)
@@ -28,6 +28,17 @@ class AzureOpenAiEmbeddingDriver(OpenAiEmbeddingDriver):
         ),
         kw_only=True,
     )
+    client: openai.AzureOpenAI = field(
+        init=False,
+        default=Factory(
+            lambda self: openai.AzureOpenAI(
+                api_key=self.api_key,
+                base_url=self.base_url,
+                organization=self.organization,
+            ),
+            takes_self=True,
+        ),
+    )
 
-    def _params(self, chunk: list[int] | str) -> dict:
+    def _params(self, chunk: str) -> dict:
         return super()._params(chunk) | {"deployment_id": self.deployment_id}
@@ -1,10 +1,9 @@
 from __future__ import annotations
-import os
 from typing import Optional
-import openai
 from attr import define, field, Factory
 from griptape.drivers import BaseEmbeddingDriver
 from griptape.tokenizers import OpenAiTokenizer
+import openai
 
 
 @define
@@ -13,9 +12,7 @@ class OpenAiEmbeddingDriver(BaseEmbeddingDriver):
     Attributes:
         model: OpenAI embedding model name. Defaults to `text-embedding-ada-002`.
         dimensions: Vector dimensions. Defaults to `1536`.
-        api_type: OpenAI API type, for example 'open_ai' or 'azure'. Defaults to 'open_ai'.
-        api_version: API version. Defaults to 'OPENAI_API_VERSION' environment variable.
-        api_base: API URL. Defaults to OpenAI's v1 API URL.
+        base_url: API URL. Defaults to OpenAI's v1 API URL.
         api_key: API key to pass directly. Defaults to `OPENAI_API_KEY` environment variable.
         organization: OpenAI organization. Defaults to 'OPENAI_ORGANIZATION' environment variable.
         tokenizer: Optionally provide custom `OpenAiTokenizer`.
@@ -26,14 +23,19 @@ class OpenAiEmbeddingDriver(BaseEmbeddingDriver):
 
     model: str = field(default=DEFAULT_MODEL, kw_only=True)
     dimensions: int = field(default=DEFAULT_DIMENSIONS, kw_only=True)
-    api_type: str = field(default=openai.api_type, kw_only=True)
-    api_version: Optional[str] = field(default=openai.api_version, kw_only=True)
-    api_base: str = field(default=openai.api_base, kw_only=True)
-    api_key: Optional[str] = field(
-        default=Factory(lambda: os.environ.get("OPENAI_API_KEY")), kw_only=True
-    )
-    organization: Optional[str] = field(
-        default=openai.organization, kw_only=True
+    base_url: str = field(default=None, kw_only=True)
+    api_key: Optional[str] = field(default=None, kw_only=True)
+    organization: Optional[str] = field(default=None, kw_only=True)
+    client: openai.OpenAI = field(
+        init=False,
+        default=Factory(
+            lambda self: openai.OpenAI(
+                api_key=self.api_key,
+                base_url=self.base_url,
+                organization=self.organization,
+            ),
+            takes_self=True,
+        ),
     )
     tokenizer: OpenAiTokenizer = field(
         default=Factory(
@@ -42,29 +44,16 @@ class OpenAiEmbeddingDriver(BaseEmbeddingDriver):
         kw_only=True,
     )
 
-    def __attrs_post_init__(self) -> None:
-        openai.api_type = self.api_type
-        openai.api_version = self.api_version
-        openai.api_base = self.api_base
-        openai.api_key = self.api_key
-        openai.organization = self.organization
-
     def try_embed_chunk(self, chunk: str) -> list[float]:
         # Address a performance issue in older ada models
         # https://github.com/openai/openai-python/issues/418#issuecomment-1525939500
         if self.model.endswith("001"):
             chunk = chunk.replace("\n", " ")
-        return openai.Embedding.create(**self._params(chunk))["data"][0][
-            "embedding"
-        ]
+        return (
+            self.client.embeddings.create(**self._params(chunk))
+            .data[0]
+            .embedding
+        )
 
     def _params(self, chunk: str) -> dict:
-        return {
-            "input": chunk,
-            "model": self.model,
-            "api_key": self.api_key,
-            "organization": self.organization,
-            "api_version": self.api_version,
-            "api_base": self.api_base,
-            "api_type": self.api_type,
-        }
+        return {"input": chunk, "model": self.model}
@@ -1,23 +1,41 @@
 from attr import define, field, Factory
-from griptape.utils import PromptStack
+from typing import Optional
 from griptape.drivers import OpenAiChatPromptDriver
+from griptape.utils.prompt_stack import PromptStack
 from griptape.tokenizers import OpenAiTokenizer
+import openai
 
 
 @define
 class AzureOpenAiChatPromptDriver(OpenAiChatPromptDriver):
     """
     Attributes:
-        api_base: API URL.
-        deployment_id: Azure OpenAI deployment ID.
-        model: OpenAI model name.
+        azure_deployment: Azure deployment id.
+        azure_endpoint: Azure endpoint.
+        azure_ad_token: Azure Active Directory token.
+        azure_ad_token_provider: Azure Active Directory token provider.
+        api_version: API version.
     """
 
-    api_base: str = field(kw_only=True)
-    model: str = field(kw_only=True)
-    deployment_id: str = field(kw_only=True)
-    api_type: str = field(default="azure", kw_only=True)
+    azure_deployment: str = field(kw_only=True)
+    azure_endpoint: str = field(kw_only=True)
+    azure_ad_token: Optional[str] = field(kw_only=True, default=None)
+    azure_ad_token_provider: Optional[str] = field(kw_only=True, default=None)
     api_version: str = field(default="2023-05-15", kw_only=True)
+    client: openai.AzureOpenAI = field(
+        default=Factory(
+            lambda self: openai.AzureOpenAI(
+                organization=self.organization,
+                api_key=self.api_key,
+                api_version=self.api_version,
+                azure_endpoint=self.azure_endpoint,
+                azure_deployment=self.azure_deployment,
+                azure_ad_token=self.azure_ad_token,
+                azure_ad_token_provider=self.azure_ad_token_provider,
+            ),
+            takes_self=True,
+        )
+    )
     tokenizer: OpenAiTokenizer = field(
         default=Factory(
             lambda self: OpenAiTokenizer(model=self.model), takes_self=True
@@ -26,6 +44,27 @@ class AzureOpenAiChatPromptDriver(OpenAiChatPromptDriver):
     )
 
     def _base_params(self, prompt_stack: PromptStack) -> dict:
-        return super()._base_params(prompt_stack) | {
-            "deployment_id": self.deployment_id
+        params = {
+            "model": self.model,
+            "temperature": self.temperature,
+            "stop": self.tokenizer.stop_sequences,
+            "user": self.user,
         }
+
+        if self.response_format == "json_object":
+            params["response_format"] = {"type": "json_object"}
+            # JSON mode still requires a system input instructing the LLM to output JSON.
+            prompt_stack.add_system_input(
+                "Provide your response as a valid JSON object."
+            )
+
+        messages = self._prompt_stack_to_messages(prompt_stack)
+
+        # A max_tokens parameter is not required, but if it is specified by the caller, bound it to
+        # the maximum value as determined by the tokenizer and pass it to the API.
+        if self.max_tokens:
+            params["max_tokens"] = self.max_output_tokens(messages)
+
+        params["messages"] = messages
+
+        return params
@@ -1,24 +1,25 @@
+from typing import Optional
 from attr import define, field, Factory
-from griptape.utils import PromptStack
 from griptape.drivers import OpenAiCompletionPromptDriver
-from griptape.tokenizers import OpenAiTokenizer
+import openai
 
 
 @define
 class AzureOpenAiCompletionPromptDriver(OpenAiCompletionPromptDriver):
-    api_base: str = field(kw_only=True)
-    model: str = field(kw_only=True)
-    deployment_id: str = field(kw_only=True)
-    api_type: str = field(default="azure", kw_only=True)
+    azure_deployment: str = field(kw_only=True)
+    azure_endpoint: str = field(kw_only=True)
+    azure_ad_token: Optional[str] = field(kw_only=True, default=None)
+    azure_ad_token_provider: Optional[str] = field(kw_only=True, default=None)
     api_version: str = field(default="2023-05-15", kw_only=True)
-    tokenizer: OpenAiTokenizer = field(
+    client: openai.AzureOpenAI = field(
         default=Factory(
-            lambda self: OpenAiTokenizer(model=self.model), takes_self=True
-        ),
-        kw_only=True,
+            lambda self: openai.AzureOpenAI(
+                organization=self.organization,
+                api_key=self.api_key,
+                api_version=self.api_version,
+                azure_endpoint=self.azure_endpoint,
+                azure_deployment=self.azure_deployment,
+            ),
+            takes_self=True,
+        )
     )
-
-    def _base_params(self, prompt_stack: PromptStack) -> dict:
-        return super()._base_params(prompt_stack) | {
-            "deployment_id": self.deployment_id
-        }
 
@@ -32,7 +32,7 @@ class BasePromptDriver(ExponentialBackoffMixin, ABC):
     tokenizer: BaseTokenizer
     stream: bool = field(default=False, kw_only=True)
 
-    def max_output_tokens(self, text: str) -> int:
+    def max_output_tokens(self, text: str | list) -> int:
         tokens_left = self.tokenizer.count_tokens_left(text)
 
         if self.max_tokens: