アクセス解析の数値には、実際のユーザーとは関係のないアクセスが多く含まれています。
これらのノイズが混ざった状態では、ChatGPT、Geminiの動きや実際のアクセス状況を正しく把握することができません。

ノイズを放置すると、AIからの参照数を過大に評価してしまい、誤った判断につながる可能性があります。
正確な状況を把握できないこと自体がリスクとなります。
従来のSEOは、単純なアクセス数を機械的に収集し、順位を決定するBotが中心でした。
一方でAIは、文脈を理解し、意味のある情報を選び取る仕組みになっています。
このような環境において、ノイズに埋もれた状態では、本来重要な情報を正しく捉えることができません。
その結果、AIによる評価や参照状況を誤って理解してしまう可能性があります。
すでに削除されたページや、存在しないURLにChatGPTがアクセスすることがあります。
これらは現在の状況とは関係のないデータのため、解析から除外します。
PHPなどでページを表示しているサイトでは、URLの指定方法によって、同じ内容のページが複数のURLとして記録されることがあります。
このようなアクセスをそのまま集計すると、解析結果にズレが生じます。
画像ファイル、JavaScript、CSSなどへのアクセスもログには記録されます。
これらはページ閲覧そのものではないため、通常のページアクセスとは分けて扱います。
ChatGPT、Geminiのように見せかけたアクセスが含まれることがあります。
これらを除外しないと、実際のChatGPTからのアクセス数を正しく把握できません。
ChatGPTによるアクセスには、情報収集のためのBotと、実際の閲覧に近いアクセスなど、目的の異なる複数の種類があります。
これらは同じIP帯域からアクセスされることもあり、区別せずに集計すると正しく把握できません。
短時間に同じようなアクセスが連続して発生することがあります。
これらはChatGPTなどの処理や自動的なアクセスによる可能性があり、そのまま集計すると解析結果にズレが生じます。
GoogleやOpenAIは利用用途に応じたIP帯を公表しています。
しかし公表されているIP帯では正しく用途を判定はできません。特にGoogleの判定は難しくIP帯だけでのGemini訪問判定はできません。Watch40xのIP監視・特定の技術ノウハウでこれを解決しています。
Google・OpenAI・Bingの用途別IP帯
WebPitaでは「AI」と「人」を可能なかぎり判別を行い解析データに反映をしています。
WebPitaの判別方法の詳細は以下に記載をしています。
WebPitaのGoogle系AI Web訪問判別方法
Google検索・AI Overview経由アクセスにおける閲覧傾向分析
WebPitaはWatch40x(Webセキュリティ監視)と連携しています。
Watch40xは悪意のあるWeb接続を常に監視しています。
ここで培ったIP監視ノウハウと観測データをWebPitaでは利用をし、AIのWeb訪問の観測結果の品質を確保しています。
結果、WebPitaはノイズを整理したクリーンなデータでChatGPT、GeminiなどのAIによるアクセスを分析します。
従来のアクセス解析では見えなかったAIの参照状況を、正確に把握することが可能です。