使用 Hugging Face Inference Endpoints 進行語義搜尋

    簡介

    本指南將逐步引導您設定 Meilisearch REST 嵌入器與Hugging Face Inference Endpoints,以啟用語義搜尋功能。

    resthuggingface

    您可以使用兩種方式使用 Hugging Face 和 Meilisearch:透過將嵌入器來源設定為 huggingface 在本機執行模型,或透過將嵌入器來源設定為 rest 在 Hugging Face 的伺服器上遠端執行。

    需求

    要遵循本指南,您需要:

    設定嵌入器

    使用更新設定端點設定嵌入器

    {
      "hf-inference": {
        "source": "rest",
        "url": "ENDPOINT_URL",
        "apiKey": "API_KEY",
        "dimensions": 384,
        "documentTemplate": "CUSTOM_LIQUID_TEMPLATE",
        "request": {
          "inputs": ["{{text}}", "{{..}}"],
          "model": "baai/bge-small-en-v1.5"
        },
        "response": ["{{embedding}}", "{{..}}"]
      }
    }
    

    在此設定中:

    設定好嵌入器後,Meilisearch 會自動為您的文件產生嵌入。使用 Cloud UI 或 get task 端點來監控任務。

    注意

    此範例使用 BAAI/bge-small-en-v1.5 作為其模型,但 Hugging Face 提供了其他選項,可能更適合您的資料集

    設定好嵌入器後,您現在可以執行語義搜尋。使用 hybrid 搜尋參數發出搜尋請求,並將 semanticRatio 設定為 1

    {
      "q": "QUERY_TERMS",
      "hybrid": {
        "semanticRatio": 1,
        "embedder": "hf-inference"
      }
    }
    

    在此請求中:

    結論

    您已使用 Hugging Face Inference Endpoints 設定好嵌入器。這讓您可以在應用程式中使用純語義搜尋功能。

    請參閱嵌入器設定文件,以取得有關其他嵌入器設定選項的更多資訊。