私たちは、Azure AI StudioのPhi-3.5-miniサーバーレスエンドポイントにGuidanceを導入し、アプリケーションに合わせた構造を定義することで出力をより予測可能にします。Guidanceを使用すると、高価な再試行を排除でき、例えば、事前定義されたリスト(例:医療コード)から選択するようモデルを制約したり、提供されたコンテキストから直接引用するよう出力を制限したり、正規表現に従わせることができます。Guidanceは推論スタック内でトークンごとにモデルを制御し、コストとレイテンシを30-50%削減します。これにより、Phi-3-miniサーバーレスエンドポイントにとってユニークで価値のある追加機能となります。
Guidance-AIは、開発者がAIモデルを効率的に作成および展開するのを支援するために設計されたフレームワークです。堅牢なAIアプリケーションを構築するためのツールとベストプラクティスを提供することに重点を置いています。
**Phi Models as a Service (MaaS)**と組み合わせることで、コスト効果が高く高性能な小型言語モデル(SLM)を展開するための強力なソリューションを提供します。
Guidance-AIは、開発者が大規模言語モデル(LLM)をより効果的に制御および操作するのを支援するためのプログラミングフレームワークです。従来のプロンプティングやファインチューニング方法と比べて、出力の構造を正確に設定し、レイテンシとコストを削減できます。
- 効率的な制御: 開発者が言語モデルのテキスト生成を制御し、高品質で関連性の高い出力を確保できます。
- コストとレイテンシの削減: 生成プロセスを最適化し、コスト効果と速度を向上させます。
- 柔軟な統合: Transformers、llama.cpp、AzureAI、VertexAI、OpenAIなど、さまざまなバックエンドと連携します。
- 豊富な出力構造: 条件分岐やループ、ツールの使用など、複雑な出力構造をサポートし、明確で解析可能な結果を生成しやすくします。
- 互換性: 単一のGuidanceプログラムが複数のバックエンドで実行可能で、柔軟性と使いやすさを向上させます。
- 制約された生成: 正規表現や文脈自由文法を使用してモデルの出力をガイドします。
- ツール統合: テキスト生成タスク内で電卓を使用するなど、制御と生成を自動的に交互に行います。
詳細な情報と例については、Guidance-AI GitHubリポジトリをご覧ください。
- コスト効果: 高性能を維持しながら手頃な価格で設計されています。
- 低レイテンシ: クイックな応答を必要とするリアルタイムアプリケーションに最適です。
- 柔軟性: クラウド、エッジ、オフラインなど、さまざまな環境で展開可能です。
- カスタマイズ: ドメイン固有のデータでモデルをファインチューニングし、性能を向上させることができます。
- セキュリティとコンプライアンス: MicrosoftのAI原則に基づいて構築され、責任、透明性、公平性、信頼性、安全性、プライバシー、包括性を確保しています。
Phiモデルは、推論APIを通じた従量課金制の料金体系で提供されており、大きな初期費用をかけずにアプリケーションに統合することが容易です。
Phiモデルの使用を開始するには、Azure AIモデルカタログやGitHub Marketplace Modelsを探索して、事前構築済みおよびカスタマイズ可能なモデルを見つけることができます。また、Azure AI Studioなどのツールを使用して、AIアプリケーションを開発および展開することができます。
免責事項:この翻訳はAIモデルによって原文から翻訳されたものであり、完璧ではない可能性があります。 出力を確認し、必要な修正を行ってください。