AI 驅動的混合搜尋目前處於封閉測試階段。 加入候補名單 以搶先體驗!

前往首頁Meilisearch 的標誌
返回文章
2024 年 9 月 26 日

跨多語言搜尋

了解實作進階多語言搜尋有多麼容易,並讓您的使用者獲得他們應得的流暢、相關的結果——無論使用何種語言。

Quentin de Quelen
Quentin de QuelenMeilisearch 共同創辦人兼執行長@Quentin_dQ
Searching across multiple languages

在當今互聯的世界中,許多應用程式需要處理多種語言的內容。Meilisearch 提供強大的多語言搜尋功能,結合智慧語言處理和專業模型,以達到最佳的相關性。本指南將引導您使用 Meilisearch 設定多語言搜尋,涵蓋全文和語意搜尋方法。

為什麼多語言搜尋很重要

在深入探討技術細節之前,讓我們先思考一下為什麼多語言搜尋至關重要

  1. 全球觸及:透過滿足使用者的母語,擴大您的受眾。
  2. 改善使用者體驗:無論查詢或內容使用何種語言,都能提供相關的結果。
  3. 提高互動:使用者更有可能與他們可以輕鬆找到和理解的內容互動。

現在,讓我們來探索 Meilisearch 如何讓多語言搜尋變得輕而易舉。

全文搜尋:智慧語言處理

Meilisearch 的核心優勢在於開箱即用地處理多種語言。我們的進階斷詞器旨在處理

  • 使用空白字元分隔單字的語言(例如英文、西班牙文和法文)
  • 具有不同書寫系統的語言(例如中文、日文和泰文)

自動語言偵測

當您將文件新增到 Meilisearch 索引時,引擎會自動偵測每個欄位的語言。這表示在大多數情況下,您不需要手動指定語言,Meilisearch 會為您處理。

例如,如果您的文件包含英文和西班牙文內容的混合

[
  {
    "id": 1,
    "title": "The quick brown fox",
    "description": "El zorro marrón rápido salta sobre el perro perezoso"
  },
  {
    "id": 2,
    "title": "La luna y las estrellas",
    "description": "A beautiful night sky filled with twinkling stars"
  }
]

Meilisearch 會自動偵測並正確處理每個欄位中的不同語言,確保跨多語言內容的準確搜尋結果。

為特定欄位指定語言

雖然自動偵測在大多數情況下運作良好,但您可能希望更精確地控制特定欄位的語言處理。Meilisearch 允許您使用 localizedAttributes 設定,為特定屬性指定語言

以下說明如何設定它

{
  "localizedAttributes": [
    {
      "locales": ["eng"],
      "attributePatterns": ["title_en", "*_english"]
    },
    {
      "locales": ["spa"],
      "attributePatterns": ["description_es", "*_spanish"]
    }
  ]
}

此設定會告知 Meilisearch 將結尾為 _en_english 的欄位視為英文,將結尾為 _es_spanish 的欄位視為西班牙文。當您對多語言欄位使用一致的命名慣例時,或當您想要確保對某些屬性進行特定處理時,此方法特別有用。

語意搜尋:增強多語言相關性

雖然全文搜尋在許多多語言情況下運作良好,但語意搜尋可以提供更好的結果,特別是對於複雜的查詢或在處理跨語言的細微含義時。

Meilisearch 支援用於語意搜尋的各種嵌入模型,提供強大的自動嵌入功能。這表示您可以輕鬆設定語意搜尋,而無需自行管理嵌入程序。Meilisearch 會自動處理嵌入的產生和儲存,將它們無縫整合到您的搜尋體驗中。

對於多語言應用程式,我們建議使用專業的多語言模型,而不是依賴通用模型。這些模型旨在理解和表示跨多種語言的含義,從而在多語言環境中產生更相關的搜尋結果。

用於多語言語意搜尋的一個絕佳選擇是 Cohere 多語言嵌入模型。它在廣泛的語言中提供了速度和相關性的良好平衡。Cohere 的模型特別擅長理解不同語言的上下文和細微差別,使其成為多樣化、多語言內容的理想選擇。如果您現在想執行,請依照指南

若要探索不同的模型及其效能,您可以使用 Meilisearch 遊樂場。這個互動式工具可讓您測試各種嵌入模型,並查看它們在您特定的多語言查詢和內容中的效能。

結論

我們鼓勵您嘗試不同的設定和模型,以找到最適合您特定使用案例的配置。請記住,Meilisearch 社群隨時提供協助 - 加入我們的 Discord 或查看我們的文件,以取得更詳細的資訊和支援。

準備好開始使用多語言搜尋了嗎?立即免費試用 14 天 Meilisearch!

Fuzzy Search: A Comprehensive Guide to Implementation

模糊搜尋:實作的完整指南

了解如何實作模糊搜尋,以處理應用程式中的錯字和拼寫錯誤。取得實用的程式碼範例和最佳實務,以獲得更好的使用者體驗。

Ilia Markov
Ilia Markov2024 年 12 月 18 日
Software Engineering Predictive Search: A Complete Guide

軟體工程預測搜尋:完整指南

了解如何在您的軟體應用程式中實作預測搜尋。探索關鍵概念、最佳化技術和真實範例,以增強使用者體驗。

Ilia Markov
Ilia Markov2024 年 12 月 11 日
Beyond the Hype: Practical AI Search Strategies That Deliver ROI

超越炒作:提供投資報酬率的實用 AI 搜尋策略

了解如何實作可帶來實際投資報酬率的 AI 驅動搜尋。透過實用的預算編列、功能選擇和衡量成功策略,擺脫炒作。

Ilia Markov
Ilia Markov2024 年 12 月 2 日