phidatahq · alphamarket · Dec 24, 2024 · Dec 30, 2024 · Jan 3, 2025
diff --git a/phi/model/base.py b/phi/model/base.py
@@ -1,3 +1,4 @@
+import base64
 import collections.abc
 
 from types import GeneratorType
@@ -494,6 +495,14 @@ def add_audio_to_message(self, message: Message, audio: Optional[Any] = None) ->
         if audio is None:
             return message
 
+        # supporting raw audio data
+        if isinstance(audio, bytes):
+            audio = base64.b64encode(audio).decode("utf-8")
+
+        # supporting pre-formatted audio data
+        if isinstance(audio, str):
+            audio = {"data": audio, "format": "wav"}
+
         # If `id` is in the audio, this means the audio is already processed
         # This is used in multi-turn conversations
         if "id" in audio: