WebPita Labo


2026-05-20

ChatGPTからの送客および送客後遷移の判定について

ChatGPT経由アクセスのWeb訪問ログについて

WebPitaでは、ChatGPT → Webサイト、および ChatGPT → Webサイト → Webサイト のアクセス遷移を接続ログから観測しています。

従来のアクセス解析では、ChatGPTからの単発アクセス判定に留まるケースが多く、送客後のサイト内遷移を把握することは困難でした。

WebPitaでは、ChatGPTからWebサイトへ訪問したアクセスと、その後のサイト内回遊をあわせて記録することで、ChatGPT経由ユーザーの関心導線を把握しています。

※ChatGPT経由アクセスは、検索エンジン型の流入と比べて発生件数が少ない傾向があります。そのためWebPitaでは、単純な流入数だけではなく、ChatGPTからWebサイトへ遷移したアクセスと、その後に継続して閲覧されたアクセスを分けて記録しています。


ChatGPT → Webサイト の判定

ChatGPTからWebサイトへ直接遷移したアクセスは、以下の情報をもとに判定しています。

  • アクセス先URLに utm_source=chatgpt.com が含まれる
  • リファラーに chatgpt.com が含まれる
  • リファラーに openai.com が含まれる

これらの条件に該当するアクセスを、ChatGPTまたはOpenAI関連ページからの流入として扱います。


ChatGPT → Webサイト → Webサイト の判定

ChatGPT経由で訪問した後のサイト内遷移も記録しています。

例えば、ChatGPT → ページA → ページB のような遷移です。

この判定では、以下の条件を利用しています。

  • リファラーに自サイトURLを含む
  • リファラーに utm_source=chatgpt.com を含む

これにより、ChatGPT経由ユーザーのサイト内回遊を把握できます。


ChatGPT経由アクセスの分類

WebPitaでは、ChatGPT経由アクセスを複数の種類に分類しています。

分類 内容
Visit_us01 ChatGPT検索経由でWebサイトへ訪問
Visit_us02 ChatGPT経由訪問後のサイト内遷移
Visit_us04 chatgpt.com のリンク経由で訪問
Visit_us05 openai.com のリンク経由で訪問
Visit_bot01〜03 botらしいアクセスとして分類

単純な「ChatGPTからのアクセス数」だけではなく、サイト内回遊やbot系アクセスも分けて確認できます。


ChatGPTリンク表示検証

WebPitaでは、ChatGPT画面上でWebPitaのURLを通常のWebリンクとして表示し、実際にクリックを行いました。

検証時には、ChatGPT画面上でWebPita公式サイトへの外部リンク表示を確認しました。

また、リンククリック後のWebアクセスログ、およびサイト内遷移ログを取得し、ChatGPT → Webサイト、ChatGPT → Webサイト → Webサイト のアクセス遷移について、実ログベースで確認を行いました。

以下は、実際にChatGPT画面上でWebPitaのURLが表示された際の検証キャプチャです。


ChatGPTがWebPita URLを通常の外部リンクとして表示した検証キャプチャ

検証データ

以下は、ChatGPT画面上に表示されたWebPitaリンクをクリックした際の接続ログです。


1回目
ChatGPT→Webサイトのログ
DATE : 2026-05-20 13:48:39
REQUEST_URI : /?utm_source=chatgpt.com
QUERY_STRING : utm_source=chatgpt.com
HTTP_REFERER : https://chatgpt.com/
HTTP_SEC_FETCH_SITE : cross-site
HTTP_SEC_FETCH_DEST : document

----------

2回目
ChatGPT→Webサイト→Webサイトのログ
DATE : 2026-05-20 13:48:49
REQUEST_URI : /labo/webPitaLabo_list.html
HTTP_REFERER : https://www.webpita.com/?utm_source=chatgpt.com
HTTP_SEC_FETCH_SITE : same-origin
HTTP_SEC_FETCH_DEST : document

1回目のアクセスでは、https://chatgpt.com/ をリファラーに持つ外部アクセスを確認できます。 また、HTTP_SEC_FETCH_SITE : cross-site となっており、ChatGPTからWebPitaへの外部遷移であることが分かります。

2回目のアクセスでは、utm_source=chatgpt.com を保持したまま、WebPita内ページへのサイト内遷移が行われています。

このログでは、2回目のアクセスにおいて、リファラーに https://www.webpita.com/?utm_source=chatgpt.com が記録されています。 これにより、ChatGPT経由アクセス後に、utm_source=chatgpt.com を保持したサイト内遷移が発生していることを確認できます。


観測対象ログ

WebPitaでは、AIが実際に参照した可能性のあるページアクセスを分析するため、観測対象を以下に限定しています。

  • HTTPステータスが 200 206 304 のアクセス
  • html php pdf ファイルへのアクセス
  • フォルダURLへのアクセス

一方で、以下のアクセスは原則として分析対象から除外しています。

  • 画像ファイル
  • CSS
  • JavaScript
  • リダイレクトアクセス
  • 404エラー

これにより、AIまたはAI経由ユーザーによる「ページ閲覧」に近いアクセスを中心に解析しています。


偽装判定

ChatGPT関連アクセスには、User-Agent偽装やbotアクセスが含まれる場合があります。

WebPitaでは、ChatGPT経由の「通常閲覧に近いアクセス」を分析するため、追加の除外・分類処理を行っています。

主な判定内容は以下です。

  • botらしいUser-Agentを持つアクセス
  • robots.txt / sitemap.xml を確認したアクセス
  • ISP・クラウド事業者からのアクセス
  • 既知bot系ネットワークからのアクセス

これらを除外または別分類することで、ChatGPT経由アクセスの分析精度向上を行っています。


robots.txt / sitemap.xml の除外

WebPitaでは、robots.txt または sitemap.xml へアクセスしたIPについて、その後のアクセスを人間判定の対象外としています。

これは、検索エンジン、クローラー、自動巡回系アクセスなどが、事前にサイト構造を確認するケースが多いためです。

例えば、/robots.txt/sitemap.xml へのアクセス後に行われるページ巡回は、AIまたはbotによる自動取得である可能性が高く、人間による通常閲覧とは異なる挙動として分類しています。

WebPitaでは、1日分の接続ログを時系列に解析し、robots.txt / sitemap.xml 確認後のアクセスを除外することで、ChatGPT経由の通常閲覧に近いアクセス精度向上を行っています。


User-Agent による判定

WebPitaでは、User-Agent文字列を利用したbotらしいアクセスの分類も行っています。

主な判定対象は以下です。

  • bot
  • crawler
  • spider
  • slurp
  • fetcher
  • headless
  • guzzle
  • curl
  • wget
  • python

これらを含むアクセスは、ChatGPT関連アクセスであっても、人間アクセスとは別分類として管理しています。

User-Agentは偽装可能であるため、WebPitaではUser-Agentのみで判定を完結させず、robots.txt / sitemap.xml 判定やISP判定などと組み合わせて分析精度向上を行っています。


ISP判定

ISP判定 内容
日本国内IP
Domestic Japanese IP
主要レンタルサーバー・クラウド事業者からの接続はBot判定とする
海外IP
Overseas IP
AbuseIPDB の usage 情報を利用しISP判定を行う

WebPitaでは、接続元IPアドレスのネットワーク種別を利用し、ChatGPT経由アクセスの分類精度向上を行っています。


補足事項

User-Agent、リファラー、IP帯域、ISP情報などは、仕様変更や偽装の影響を受ける場合があります。

特に生成AI関連サービスでは、アクセス方式、リファラー形式、User-Agent、利用ネットワークなどが継続的に変更される可能性があります。

WebPitaでは、実際の観測ログや公開情報をもとに、継続的に判定ロジックの見直しを行っています。


ChatGPT経由アクセスは、どこまで判別できるのか?

WebPita AI Console for ChatGPT