web_fetch のフォールバック エクストラクターとして使用できます。ホスト型です
ボットの回避とキャッシュをサポートするコンテンツ抽出サービス。
プレーンな HTTP フェッチをブロックする JS を多用するサイトまたはページ。
API キーを取得する
- Firecrawl アカウントを作成し、API キーを生成します。
- config に保存するか、ゲートウェイ環境で
FIRECRAWL_API_KEYを設定します。
Firecrawl を設定する
- API キーが存在する場合、
firecrawl.enabledはデフォルトで true になります。 maxAgeMsは、キャッシュされた結果の古さ (ミリ秒) を制御します。デフォルトは 2 日です。
ステルス/ボット回避
Firecrawl は、ボット回避のための プロキシ モード パラメーター (basic、stealth、または auto) を公開します。
OpenClaw は、Firecrawl リクエストに常に proxy: "auto" と storeInCache: true を使用します。
プロキシが省略された場合、Firecrawl はデフォルトで auto になります。 auto 基本的な試行が失敗した場合、ステルス プロキシを使用して再試行します。これにより、より多くのクレジットが使用される可能性があります。
基本のみのスクレイピングよりも。
web_fetch による Firecrawl の使用方法
web_fetch 抽出順序:
- 可読性 (ローカル)
- Firecrawl (構成されている場合)
- 基本的な HTML クリーンアップ (最後のフォールバック)