ChatGPT、Geminiアクセス解析のノイズとその影響について

アクセス解析の「ノイズ」について

アクセス解析の数値には、実際のユーザーとは関係のないアクセスが多く含まれています。
これらのノイズが混ざった状態では、ChatGPT、Geminiの動きや実際のアクセス状況を正しく把握することができません。


WebPita AI Console for ChatGPT


なぜノイズが問題か

ノイズを放置すると、AIからの参照数を過大に評価してしまい、誤った判断につながる可能性があります。
正確な状況を把握できないこと自体がリスクとなります。

従来のSEOは、単純なアクセス数を機械的に収集し、順位を決定するBotが中心でした。
一方でAIは、文脈を理解し、意味のある情報を選び取る仕組みになっています。

このような環境において、ノイズに埋もれた状態では、本来重要な情報を正しく捉えることができません。
その結果、AIによる評価や参照状況を誤って理解してしまう可能性があります。


解析前に取り除く主なノイズ

1. 存在しないページへのアクセス

すでに削除されたページや、存在しないURLにChatGPTがアクセスすることがあります。
これらは現在の状況とは関係のないデータのため、解析から除外します。

2. PHPで生成されるページの重複

PHPなどでページを表示しているサイトでは、URLの指定方法によって、同じ内容のページが複数のURLとして記録されることがあります。
このようなアクセスをそのまま集計すると、解析結果にズレが生じます。

3. 画像・JavaScript・CSSなどへのアクセス

画像ファイル、JavaScript、CSSなどへのアクセスもログには記録されます。
これらはページ閲覧そのものではないため、通常のページアクセスとは分けて扱います。

4. ChatGPT、Geminiを装ったアクセス

ChatGPT、Geminiのように見せかけたアクセスが含まれることがあります。
これらを除外しないと、実際のChatGPTからのアクセス数を正しく把握できません。

5. ChatGPTの異なるアクセスの混在

ChatGPTによるアクセスには、情報収集のためのBotと、実際の閲覧に近いアクセスなど、目的の異なる複数の種類があります。
これらは同じIP帯域からアクセスされることもあり、区別せずに集計すると正しく把握できません。

6. 不審な連続したアクセス

短時間に同じようなアクセスが連続して発生することがあります。
これらはChatGPTなどの処理や自動的なアクセスによる可能性があり、そのまま集計すると解析結果にズレが生じます。

7.GeminiやChatGPTのIP帯判定

GoogleやOpenAIは利用用途に応じたIP帯を公表しています。
しかし公表されているIP帯では正しく用途を判定はできません。特にGoogleの判定は難しくIP帯だけでのGemini訪問判定はできません。Watch40xのIP監視・特定の技術ノウハウでこれを解決しています。
Google・OpenAI・Bingの用途別IP帯


WebPitaのAI訪問、AI送客(人の流入)の判定方法

WebPitaでは「AI」と「人」を可能なかぎり判別を行い解析データに反映をしています。
WebPitaの判別方法の詳細は以下に記載をしています。
WebPitaのGoogle系AI Web訪問判別方法
Google検索・AI Overview経由アクセスにおける閲覧傾向分析


WebPita×Watch40xの連携

WebPitaはWatch40x(Webセキュリティ監視)と連携しています。
Watch40xは悪意のあるWeb接続を常に監視しています。
ここで培ったIP監視ノウハウと観測データをWebPitaでは利用をし、AIのWeb訪問の観測結果の品質を確保しています。
結果、WebPitaはノイズを整理したクリーンなデータでChatGPT、GeminiなどのAIによるアクセスを分析します。
従来のアクセス解析では見えなかったAIの参照状況を、正確に把握することが可能です。

Watch40xについて
Watch40xの観測レポート

AIアクセス解析ツールで何が見えるのか?

WebPita AI Console for ChatGPT