OCR検索

要件
ログインの有無 True
エンドポイント /v1/search
メソッド GET

概要

画像の情報を編集可能な文字情報に変換する。

最大検索可能文字数

255文字まで

対象文字種

日本語文字

  • ひらがな(あ~ん)
  • カタカナ(ア~ン)
  • 漢字(CJK Unified Ideographs)

英数字

  • A-Z/a-z
  • 0-9(全角・半角)

記号

  • 一般記号:_ . / @ # & % ? !
  • かっこ類:() [] <>
  • 句読点:、 。 , .

\

必要なデータ

キー 値の種類 必須 説明
type String True ベクトル検索=vector / ファイル名=filename / アカウント名=account / OCR=ocr / 内容=content
keyword String True 検索キーワード(最大255文字)

表示するデータ

キー 値の種類
match_keyword String

実装要件

必要なコンポーネント

コンポーネント 技術 備考
OCRエンジン PaddleOCR / EasyOCR 詳細: インフラ/OCRエンジン.md
処理サービス Python FastAPI OCR処理・Valkey連携
タスクキュー Valkey 非同期OCRジョブ管理
ブラウザ拡張 Plasmo ブラウザ上の画像キャプチャ・送信
データ保存 PostgreSQL 抽出テキストのFTSインデックス化

処理タイミング

画像ファイルアップロード時およびブラウザ拡張からの送信時に非同期で処理。