WebPitaでは、ChatGPT → Webサイト、および ChatGPT → Webサイト → Webサイト のアクセス遷移を接続ログから観測しています。
従来のアクセス解析では、ChatGPTからの単発アクセス判定に留まるケースが多く、送客後のサイト内遷移を把握することは困難でした。
WebPitaでは、ChatGPTからWebサイトへ訪問したアクセスと、その後のサイト内回遊をあわせて記録することで、ChatGPT経由ユーザーの関心導線を把握しています。
※ChatGPT経由アクセスは、検索エンジン型の流入と比べて発生件数が少ない傾向があります。そのためWebPitaでは、単純な流入数だけではなく、ChatGPTからWebサイトへ遷移したアクセスと、その後に継続して閲覧されたアクセスを分けて記録しています。
ChatGPTからWebサイトへ直接遷移したアクセスは、以下の情報をもとに判定しています。
utm_source=chatgpt.com が含まれるchatgpt.com が含まれるopenai.com が含まれるこれらの条件に該当するアクセスを、ChatGPTまたはOpenAI関連ページからの流入として扱います。
ChatGPT経由で訪問した後のサイト内遷移も記録しています。
例えば、ChatGPT → ページA → ページB のような遷移です。
この判定では、以下の条件を利用しています。
utm_source=chatgpt.com を含むこれにより、ChatGPT経由ユーザーのサイト内回遊を把握できます。
WebPitaでは、ChatGPT経由アクセスを複数の種類に分類しています。
| 分類 | 内容 |
|---|---|
| Visit_us01 | ChatGPT検索経由でWebサイトへ訪問 |
| Visit_us02 | ChatGPT経由訪問後のサイト内遷移 |
| Visit_us04 | chatgpt.com のリンク経由で訪問 |
| Visit_us05 | openai.com のリンク経由で訪問 |
| Visit_bot01〜03 | botらしいアクセスとして分類 |
単純な「ChatGPTからのアクセス数」だけではなく、サイト内回遊やbot系アクセスも分けて確認できます。
WebPitaでは、ChatGPT画面上でWebPitaのURLを通常のWebリンクとして表示し、実際にクリックを行いました。
検証時には、ChatGPT画面上でWebPita公式サイトへの外部リンク表示を確認しました。
また、リンククリック後のWebアクセスログ、およびサイト内遷移ログを取得し、ChatGPT → Webサイト、ChatGPT → Webサイト → Webサイト のアクセス遷移について、実ログベースで確認を行いました。
以下は、実際にChatGPT画面上でWebPitaのURLが表示された際の検証キャプチャです。
以下は、ChatGPT画面上に表示されたWebPitaリンクをクリックした際の接続ログです。
1回目
ChatGPT→Webサイトのログ
DATE : 2026-05-20 13:48:39
REQUEST_URI : /?utm_source=chatgpt.com
QUERY_STRING : utm_source=chatgpt.com
HTTP_REFERER : https://chatgpt.com/
HTTP_SEC_FETCH_SITE : cross-site
HTTP_SEC_FETCH_DEST : document
----------
2回目
ChatGPT→Webサイト→Webサイトのログ
DATE : 2026-05-20 13:48:49
REQUEST_URI : /labo/webPitaLabo_list.html
HTTP_REFERER : https://www.webpita.com/?utm_source=chatgpt.com
HTTP_SEC_FETCH_SITE : same-origin
HTTP_SEC_FETCH_DEST : document
1回目のアクセスでは、https://chatgpt.com/ をリファラーに持つ外部アクセスを確認できます。
また、HTTP_SEC_FETCH_SITE : cross-site となっており、ChatGPTからWebPitaへの外部遷移であることが分かります。
2回目のアクセスでは、utm_source=chatgpt.com を保持したまま、WebPita内ページへのサイト内遷移が行われています。
このログでは、2回目のアクセスにおいて、リファラーに https://www.webpita.com/?utm_source=chatgpt.com が記録されています。
これにより、ChatGPT経由アクセス後に、utm_source=chatgpt.com を保持したサイト内遷移が発生していることを確認できます。
WebPitaでは、AIが実際に参照した可能性のあるページアクセスを分析するため、観測対象を以下に限定しています。
200 206 304 のアクセスhtml php pdf ファイルへのアクセス一方で、以下のアクセスは原則として分析対象から除外しています。
これにより、AIまたはAI経由ユーザーによる「ページ閲覧」に近いアクセスを中心に解析しています。
ChatGPT関連アクセスには、User-Agent偽装やbotアクセスが含まれる場合があります。
WebPitaでは、ChatGPT経由の「通常閲覧に近いアクセス」を分析するため、追加の除外・分類処理を行っています。
主な判定内容は以下です。
これらを除外または別分類することで、ChatGPT経由アクセスの分析精度向上を行っています。
WebPitaでは、robots.txt または sitemap.xml へアクセスしたIPについて、その後のアクセスを人間判定の対象外としています。
これは、検索エンジン、クローラー、自動巡回系アクセスなどが、事前にサイト構造を確認するケースが多いためです。
例えば、/robots.txt や /sitemap.xml へのアクセス後に行われるページ巡回は、AIまたはbotによる自動取得である可能性が高く、人間による通常閲覧とは異なる挙動として分類しています。
WebPitaでは、1日分の接続ログを時系列に解析し、robots.txt / sitemap.xml 確認後のアクセスを除外することで、ChatGPT経由の通常閲覧に近いアクセス精度向上を行っています。
WebPitaでは、User-Agent文字列を利用したbotらしいアクセスの分類も行っています。
主な判定対象は以下です。
これらを含むアクセスは、ChatGPT関連アクセスであっても、人間アクセスとは別分類として管理しています。
User-Agentは偽装可能であるため、WebPitaではUser-Agentのみで判定を完結させず、robots.txt / sitemap.xml 判定やISP判定などと組み合わせて分析精度向上を行っています。
| ISP判定 | 内容 |
|---|---|
| 日本国内IP Domestic Japanese IP |
主要レンタルサーバー・クラウド事業者からの接続はBot判定とする |
| 海外IP Overseas IP |
AbuseIPDB の usage 情報を利用しISP判定を行う |
WebPitaでは、接続元IPアドレスのネットワーク種別を利用し、ChatGPT経由アクセスの分類精度向上を行っています。
User-Agent、リファラー、IP帯域、ISP情報などは、仕様変更や偽装の影響を受ける場合があります。
特に生成AI関連サービスでは、アクセス方式、リファラー形式、User-Agent、利用ネットワークなどが継続的に変更される可能性があります。
WebPitaでは、実際の観測ログや公開情報をもとに、継続的に判定ロジックの見直しを行っています。