WebPita Labo


2025-05-14

Google検索・AI Overview経由アクセスにおける閲覧傾向分析 Analysis of Browsing Trends in Google Search and AI Overview Referral Access

概要(Abstract) Abstract

本レポートのデータはWebPita.comの機能を利用して観測をしている。
本レポートでは、Google検索画面およびGoogle AI Overview画面からのアクセスについて、Webアクセスログを用いた閲覧傾向の観測を行った。

観測では、Google referer を持つアクセスのうち、HTTP 200ステータスかつ html / php / pdf / ディレクトリアクセスを対象とし、画像・CSS・JavaScript・リダイレクト・エラーアクセス等を除外した。

また、User-Agent判定、アクセス挙動判定、およびISP判定を組み合わせることで、「実コンテンツ閲覧に近いアクセス」の抽出を試みた。

観測の結果、Google referer を持つアクセスのうち、「人間らしいアクセス」と推測される割合は約40%〜60%程度で推移した。

一方で、Google referer を持つアクセスの中には、自動巡回やBot的特徴を持つアクセスも多数含まれていることが確認された。

また、PDF・技術情報を掲載する情報提供型サイトと、写真閲覧主体サイトでは、人間率に差異が確認され、コンテンツ特性がアクセス傾向へ影響している可能性が示された。

本観測は、「人間による操作」を完全に証明するものではなく、Webアクセスログを用いた閲覧傾向の観測結果として整理している。


Analysis of browsing trends in Google Search and AI Overview referral access using web access logs. Human-like access rates, User-Agent analysis, ISP classification, bot traffic analysis, and real content browsing conditions were observed.

第1章 本レポートの目的 Chapter 1 : Purpose of This Report

本レポートでは、Google検索画面およびGoogle AI Overview画面からのアクセスについて、Webアクセスログを用いた閲覧傾向の観測を行った。

観測では、Google referer を持つアクセスを対象として、「実コンテンツ閲覧に近いアクセス」がどの程度存在するかについて分析を実施している。

また、Google referer を持つアクセスの中に、自動巡回やBot的特徴を持つアクセスがどの程度含まれているかについても観測を行った。

第2章 観測対象アクセス Chapter 2 : Target Access for Observation

観測では、Web接続ログより以下の条件に該当するレコードを対象とした。

項目
Target Item
内容
Description
対象接続ログ
Target Access Logs
HTTP 200ステータスで、拡張子が html / php / pdf のファイル、およびディレクトリアクセスを対象とする

HTTP 200 access to html / php / pdf files and directory access were targeted.
※リダイレクト・エラー・画像・CSS・JavaScript等の取得を除外し、実コンテンツ閲覧に近いアクセスを観測対象とした

Redirects, errors, images, CSS, JavaScript, and similar requests were excluded.
対象のGoogle referer
Target Google referer
https://gemini.google.com/
https://bard.google.com/
https://www.google.com/
https://www.google.co.jp/
android-app://com.google.android.googlequicksearchbox/

第3章 人間らしいアクセスの判定 Chapter 3 : Classification of Human-like Access

判定は、ユーザーエージェントおよびアクセス挙動による判定と、ISP判定の2段階で実施した。

完全な「人間による操作」の判定は困難であるため、本観測では「Hosting / Datacenter系ISPからの接続を除外することで、Botアクセスの多くを除外できる」という仮説に基づき集計を行っている。

一方で、AS Name取得等の外部照会はシステム負荷が高く、また全てのISP情報を保持しているわけではない。そのため前段として、ユーザーエージェントやアクセス挙動による簡易的な除外判定を実施している。

判定方法 Classification Method

判定分類
Classification
判定内容
Check Item
条件
Condition
UAや挙動による判定
UA / Behavior Check
User-Agentチェック
User-Agent Check
User-Agent文字列が極端に短い場合はNGとする

Marked NG when the User-Agent string is extremely short.
User-Agent文字列にbotらしき文字列が含まれる場合はNGとする

Marked NG when bot-like keywords exist.
ブラウザ要素(mozillaやchrome等)が存在しない場合はNGとする

Marked NG when browser elements are missing.
ブラウザVersion要素が存在しない場合はNGとする

Marked NG when browser version elements are missing.
request_uriチェック
request_uri Check
request_uri が空白の場合はNGとする

Marked NG when request_uri is blank.
挙動チェック
Behavior Check
robots.txt / sitemap.xml にアクセスしたIPはNGとする

IPs accessing robots.txt or sitemap.xml were marked NG.
2秒以内に複数ページを閲覧しているIPはNGとする

IPs accessing multiple pages within two seconds were marked NG.
ISP判定
ISP Classification
日本国内IP
Domestic Japanese IP
主要レンタルサーバー接続であればNG判定とする

Major hosting provider access was marked NG.
海外IP
Overseas IP
AbuseIPDB の usage 情報を利用しISP判定を行う

ISP classification was performed using AbuseIPDB usage information.

第4章 観測対象サイト Chapter 4 : Observed Websites

本観測では、コンテンツ特性の異なる2種類のWebサイトを対象として観測を行った。

サイト
Site
コンテンツ特性
Content Characteristics
A 業界情報・行政情報等を掲載する情報提供型サイト。 HTMLおよびPDFによる技術情報・業界資料を掲載している。

Information-oriented website containing technical documents and PDF files.
B 土木写真を中心とした写真閲覧型サイト。 約4000点の写真を掲載している。

Photo-browsing website containing approximately 4,000 civil engineering photos.

第5章 観測結果 Chapter 5 : Observation Results

2026年5月5日〜2026年5月13日の期間において、Google検索画面およびGoogle AI Overview画面からのアクセスを対象に観測を行った。

site_id Google referer全件
All Google referer Access
HTML/PHP/PDF
HTTP 200 Content Access
UA/挙動 NG
UA / Behavior NG
ISP NG
ISP NG
人間らしいアクセス
Human-like Access
人間率
Human-like Access Rate
A 4,102 3,791 1,421 775 1,595 42.1%
B 5,535 2,416 433 663 1,320 54.6%

アクセス分類(site A) Access Classification : Site A

アクセス分類(site B) Access Classification : Site B

円グラフは「実コンテンツ閲覧に近いアクセス」を対象とした分類結果を示す。
The pie charts show classification results for access close to real content browsing.

日付別推移(site A) Daily Trend : Site A

日付
Date
Google referer全件
All Google referer Access
対象件数
Target Count
UA/挙動NG
UA / Behavior NG
ISP NG
ISP NG
人間らしいアクセス
Human-like Access
人間率
Human-like Access Rate
2026/5/514812422475544.4%
2026/5/620517847527944.4%
2026/5/770967332010824536.4%
2026/5/859755821510923441.9%
2026/5/921419848638743.9%
2026/5/1020218544578445.4%
2026/5/1165460423812723939.6%
2026/5/126475952359926143.9%
2026/5/1372667625211331146.0%

日付別推移(site B) Daily Trend : Site B

日付
Date
Google referer全件
All Google referer Access
対象件数
Target Count
UA/挙動NG
UA / Behavior NG
ISP NG
ISP NG
人間らしいアクセス
Human-like Access
人間率
Human-like Access Rate
2026/5/5671272329314754.0%
2026/5/6520207155513766.2%
2026/5/7702317697817053.6%
2026/5/8650301767614949.5%
2026/5/9545230316313659.1%
2026/5/10551211195913363.0%
2026/5/11613281637414451.2%
2026/5/12642318768116150.6%
2026/5/13641279528414351.3%

第6章 考察 Chapter 6 : Discussion

本観測では、Google検索画面およびGoogle AI Overview画面からのアクセスであっても、その全てが「人間による閲覧」であるとは限らない傾向が確認された。

  • robots.txt / sitemap.xml への巡回
  • Hosting / Datacenter系ISPからの接続
  • 不自然なUser-Agent
  • 高頻度アクセス

等、自動巡回やBot的特徴を持つアクセスが多数含まれていた。

また、観測対象サイトによって、「人間らしいアクセス」の割合に差異が確認された。

site A では、人間率は約40%台で推移し、UAや挙動による除外件数が多い傾向が見られた。

一方、site B では50%〜60%台で推移し、比較的安定した閲覧傾向が確認された。

この差異には、

  • PDF掲載
  • 技術情報量
  • 検索導線
  • ページ構成
  • コンテンツ特性

等が影響している可能性が考えられる。

そのため、Google検索・AI Overview経由アクセスの分析では、単純なアクセス数のみではなく、

  • 実コンテンツ閲覧条件
  • User-Agent
  • ISP
  • アクセス挙動

等を組み合わせた分析が重要であると考えられる。

第7章 まとめ Chapter 7 : Conclusion

本観測では、Google検索画面およびGoogle AI Overview画面からのアクセスについて、Webアクセスログを用いた閲覧傾向の分析を行った。

その結果、Google referer を持つアクセスの中には、自動巡回やBot的特徴を持つアクセスが多数含まれていることが確認された。

また、サイト特性によって「人間らしいアクセス」の割合に差異が存在し、コンテンツ構成や掲載情報がアクセス傾向へ影響している可能性が確認された。

AI時代のアクセス解析では、単純なアクセス数のみではなく、

  • User-Agent
  • ISP
  • アクセス挙動
  • 実コンテンツ閲覧条件

等を組み合わせた多面的なアクセス解析が重要になると考えられる。