FastAPIで独自のフォーラムを構築する:ステップ8 - 全文検索

要約
このガイドでは、PostgreSQLの`tsvector`、SQLトリガー、および新しい検索ルートを使用して、FastAPIフォーラムに強力な全文検索を追加します。
意見はこのエリアに表示されます
アイキャッチ画像

前の記事では、フォーラムの基本的な権限システムを実装し、「管理者」と「ユーザーの禁止」機能をサポートして、健全なコミュニティの基盤を築きました。

フォーラムにコンテンツが増えるにつれて、ユーザーは興味のある古い投稿を見つけるのが難しくなるかもしれません。新しい要件が発生しています。ユーザーが読みたい記事をすばやく見つけるための検索機能が必要なのではないでしょうか?

この記事では、フォーラムに全文検索機能を追加します。

SQLの知識があれば、「LIKE '%keyword%'クエリを使用して検索を実装できないか?」と考えるかもしれません。簡単なシナリオでは、これは実際可能です。しかし、LIKEクエリは大量のテキストを扱う際には極端にパフォーマンスが悪く、言語的な複雑さを理解できません(たとえば、「create」を検索しても「creating」には一致しません)。

したがって、より専門的で効率的なソリューションを採用します。PostgreSQLの組み込み全文検索(FTS)機能を使用します。これは高速であるだけでなく、ステミング、ストップワードの無視、関連性によるソートもサポートしており、LIKEよりもはるかに優れた検索機能を提供します。

ステップ1:データベース検索インフラストラクチャ(SQL)

PostgreSQLのFTS機能を使用するには、まずpostsテーブルにいくつかの変更を加える必要があります。最適化された高速検索可能なテキストデータを格納するために、特別な列を作成します。

tsvector列の追加

postsテーブルにtsvector型の新しい列search_vectorを追加します。これは辞書のようなもので、投稿のタイトルとコンテンツを個々の単語(レキセム)に分解して処理します。

tsvector列を自動的に更新するためのトリガーの使用

search_vector列自体にはコンテンツはありません。タイトルとコンテンツをtsvector形式に変換し、この列に書き込む必要があります。

投稿が作成または更新されるたびにsearch_vector列を手動で更新する人は誰もいません。最善の方法は、トリガーを使用してデータベースにこの作業を自動的に実行させることです。

まず、関数を作成します。この関数の役割は、titlecontentを連結し、それらをtsvector形式に変換することです。

setweight関数を使用すると、異なるフィールドからのテキストに異なる重みを設定できます。ここでは、タイトル('A')の重みをコンテンツ('B')よりも高く設定しています。これは、検索結果において、タイトルにキーワードが含まれる投稿がより高くランク付けされることを意味します。

次に、新しい投稿が挿入(INSERT)または更新(UPDATE)されるたびに、作成した関数を自動的に呼び出すトリガーを作成します。

検索インデックスの作成

検索速度を確保するために、最後のステップはsearch_vector列にGIN(Generalized Inverted Index)インデックスを作成することです。

ステップ2:既存データのバックフィル

作成したトリガーは、今後作成または変更される投稿にのみ機能することに注意してください。データベースに既に存在する投稿については、search_vectorフィールドはまだNULLです。

既存のすべての投稿の検索ベクトルを生成するために、1回限りのUPDATEステートメントを実行する必要があります。

データベースがLeapcellを使用して作成された場合、

ImageLc

これらのSQLステートメントをWebベースの操作パネルで直接実行できます。

ImageDb

ステップ3:検索結果ページの作成

検索結果を表示するための新しいHTMLページが必要です。

templatesフォルダーにsearch_results.htmlという名前の新しいファイルを作成します。このページはposts.htmlに非常に似ていますが、ユーザーの検索クエリも追加で表示されます。

templates/search_results.html

検索ボックスのvalue属性にも{{ query }}を配置したことに注意してください。これにより、検索後も検索ボックスにユーザーの検索用語が保持されます。

ステップ4:検索バックエンドルートの実装

データベースとフロントエンドページが準備できたので、main.pyに検索リクエストを処理するバックエンドロジックを追加します。

まず、Postモデルを更新します。

models.py

次に、main.pyを修正します。

main.py (新しいルートとインポートを追加)

新しいGET /searchルートは主に以下のことを行います。

  1. qパラメータ(検索用語)を読み取り、スペースを&に置き換えます。これにより、クエリはすべてのキーワードに一致します。
  2. func.to_tsqueryfunc.ts_rank、およびop('@@')を使用して、専門的なFTSクエリを構築し、結果を関連性(ts_rank)で降順にソートします。
  3. クエリ結果でsearch_results.htmlテンプレートをレンダリングします。

ステップ5:ホームページへの検索ボックスの追加

最後に、フォーラムのホームページでユーザーに検索エントリポイントを提供する必要があります。

templates/posts.htmlを修正して、<header>に検索フォームを追加します。

templates/posts.html (ヘッダーを更新)

また、<h1>タグに<a>リンクを追加し、ユーザーがタイトルをクリックしてホームページに戻れるようにしました。

実行と検証

機能が実装されました。uvicornサーバーを再起動します。

ブラウザを開き、http://127.0.0.1:8000にアクセスします。

ページの上部にあるタイトル横に新しい検索ボックスが表示されます。

ImageP1

検索ボックスに任意の単語を入力してEnterキーを押します。ページは/searchルートにリダイレクトされ、関連する投稿が表示されます。

ImageP2

まとめ

PostgreSQL FTSを活用することで、フォーラムに強力でプロフェッショナルな全文検索機能を追加しました。ユーザーは過去の投稿を簡単に見つけることができるようになりました。

次に、フォーラムの機能をさらに充実させていきましょう。投稿はプレーンテキストのみで、画像を含めることができないことに気づいたかもしれません。

次の記事では、投稿作成時にユーザーが画像をアップロードできるように実装します。


Xでフォローする:@LeapcellJapan


本シリーズの他の記事を読む

関連記事:

Explore More
関連記事はありません。