2026-05-19
WebPitaでのChatGPT関連アクセス判定方法
ChatGPT Related Access Detection Methods in WebPita
WebPitaでは、「AIによるWebサイト訪問」と、AI経由で送客された「人間による訪問」を分けて観測しています。
本記事では、このうちOpenAI系AIによるWebサイト訪問の判定方法に絞って記載します。
WebPitaでは、ChatGPT関連アクセスの判定において、OpenAIが公開しているUser-Agent情報およびIPレンジ情報をもとに解析を行っています。
判定対象には、AI学習用クローラー「GPTBot」、ChatGPT内でのユーザー操作に伴う取得を行う「ChatGPT-User」、検索機能向けの「OAI-SearchBot」などを含みます。
なお、User-Agentは偽装可能であり、またOpenAI側の仕様変更や新しいアクセス方式の追加も存在するため、完全な判定を保証するものではありません。
本記事では、WebPitaにおけるChatGPT関連アクセスの判定対象、および判定方法について整理します。
観測では、OpenAI系User-Agentに一致したアクセス数(OpenAI系UA一致数)と、OpenAI公式IPレンジ照合後の最終判定数を分けて記録しています。
OpenAI系User-Agent一致数に対して、OpenAI公式IPレンジ照合後には最終判定数が減少する結果が確認されました。 これは、User-Agent文字列のみではOpenAI系アクセスを十分に判定できない可能性を示しています。
WebPitaでは、OpenAI公式IPレンジとの照合を組み合わせることで、OpenAI関連アクセスの判定精度向上を行っています。
| 日付 Date |
総ログ件数 Total Log Records |
OpenAI系UA一致数 OpenAI UA Matches |
最終判定数 Final Matched Records |
最終判定率 Final Match Rate |
|---|---|---|---|---|
| 2026-05-13 | 25494 | 881 | 687 | 77.98% |
| 2026-05-12 | 25785 | 5426 | 4808 | 88.61% |
| 2026-05-11 | 16764 | 952 | 713 | 74.89% |
WebPita separately observes “AI-driven website visits” and “human visits referred by AI services.”
This article focuses specifically on the detection methods used for OpenAI-related AI website visits.
WebPita analyzes ChatGPT-related access based on User-Agent information and IP range information published by OpenAI.
Detection targets include the AI training crawler “GPTBot,” “ChatGPT-User” used for user-triggered retrieval within ChatGPT, and “OAI-SearchBot” used for OpenAI search-related functionality.
WebPita does not rely solely on User-Agent names for detection. Instead, it improves detection accuracy by combining User-Agent verification with official OpenAI IP range verification.
User-Agent strings can be spoofed, and OpenAI continuously changes specifications and introduces new access methods. Therefore, complete identification cannot be guaranteed.
This article summarizes the detection targets and detection methods used by WebPita for ChatGPT-related access.
During observation, WebPita separately recorded accesses matching OpenAI-related User-Agent strings (OpenAI UA Matches) and the final verified records after official OpenAI IP range verification.
Compared to the number of OpenAI-related User-Agent matches, a reduction in the number of final verified records was observed after official OpenAI IP range verification.
This result suggests that User-Agent strings alone may not be sufficient for accurately identifying OpenAI-related access.
WebPita improves detection accuracy for OpenAI-related access by combining official OpenAI IP range verification with User-Agent verification.
観測対象とするアクセスログは、HTTPステータスコードが 200、206、304 のアクセスに限定しています。
また、アクセス対象は html、php、pdf ファイル、およびフォルダへのアクセスを対象としています。
画像ファイル(jpg、png、webp など)、CSS、JavaScript等の静的ファイルは観測対象外としています。
これは、AIによるWebページ閲覧、およびコンテンツ取得に近いアクセスを対象とするためです。
HTTPステータス 304 は、キャッシュ利用時の再検証アクセスとして観測対象に含めています。
画像ファイルやCSS、JavaScript等の静的ファイルは、ページ描画補助通信となるため観測対象外としています。
WebPitaでは、OpenAIが公開している公式IPレンジ情報を利用し、アクセス元IPアドレスとの照合を行っています。
判定には、OpenAI公式JSONで公開されているCIDR情報を利用しています。
また、WebPitaではOpenAI公式IPレンジ情報を定期的に取得し、最新情報だけではなく過去履歴も保持しています。
アクセス判定では、観測日時点に対応したIPレンジ情報を利用して照合を行っています。
これにより、IPレンジ変更後に過去ログを解析した場合でも、観測日時点に近い判定を行えるようにしています。
OpenAIでは、用途ごとに異なるIPレンジJSONを公開しています。
WebPitaでは、用途別JSONごとに分類管理を行い、アクセス用途ごとの差異も観測対象としています。
なお、User-Agent情報のみでは判定を行わず、OpenAI公式IPレンジとの一致確認を組み合わせることで、判定精度の向上を行っています。
| JSON | 用途 |
|---|---|
| gptbot.json | AI学習用クローラー |
| chatgpt-user.json | ChatGPT内でのユーザー操作に伴う取得 |
| oai-searchbot.json | OpenAI検索機能用クローラー |
| chatgpt-actions.json | GPTs Actions用 |
| chatgpt-connectors.json | ChatGPT外部連携用 |
| oai-adsbot.json | 広告審査・広告関連取得用 |
WebPitaでは、OpenAI公式IPレンジとの一致確認後、User-Agent文字列との照合を行っています。
これは、User-Agent文字列のみでは第三者による偽装が可能であるためです。
User-Agentには、以下のキーワードを利用しています。
| category | User-Agent判定文字列(User-Agent Match String) |
|---|---|
| GPTBot | gptbot |
| OAI-SearchBot | searchbot |
| ChatGPT-User | chatgpt-user |
| ChatGPT Actions | actions(補助判定用途) |
User-Agent判定では、OpenAI系アクセス種別ごとに文字列確認を行い、用途別に分類しています。
なお、ChatGPT Actions 系アクセスについては、User-Agentのみで断定せず、OpenAI公式IPレンジ情報との一致確認を優先しています。
ChatGPT-User は、ユーザー操作に伴う取得用途であり、AI学習用クローラーである GPTBot とは用途が異なります。
なお、User-Agent文字列のみでは判定を行わず、OpenAI公式IPレンジとの一致確認を組み合わせて利用しています。
OpenAIは、ChatGPT関連アクセスの仕様、User-Agent、IPレンジ分類を継続的に変更・追加しています。
そのためWebPitaでは、OpenAI公式IPレンジ情報の更新状況や実際の観測ログをもとに、判定ロジックを継続的に見直しています。
ChatGPT Actions や Connectors 系アクセスについては、外部サービス連携用途を含むため、今後アクセス仕様が大きく変化する可能性があります。
本判定は、OpenAI公式公開情報と実際のアクセスログ観測を組み合わせた観測ベース判定です。
OpenAI内部仕様そのものを取得しているものではありません。
そのため、ChatGPT関連アクセスを完全に断定するものではなく、OpenAI系AIアクセスの可能性が高いアクセス群を用途別に分類するための判定方法です。
本記事の内容は、OpenAI公式公開情報、および実際のアクセスログ観測結果をもとに整理しています。
WebPitaでは、OpenAI関連アクセスについて、User-Agent・IPレンジ・アクセス対象・HTTPステータスなど複数条件を組み合わせて観測しています。
参考:OpenAI公式情報
OpenAI公開JSONのURL構成や用途分類は、OpenAI側の仕様変更により変更される場合があります。
WebPitaでは、OpenAI公式公開情報および実際の観測ログをもとに、継続的に判定ロジックの更新を行っています。