# robots.txt の書き方

robots.txt は、ウェブサイトにアクセスする検索エンジンのクローラー（ロボット）がどのページやファイルをクロールできるかを指定するためのテキストファイルです。robots.txt の設定は強制的なものではなく、指定を行っても検索してしまう検索エンジンもある可能性があります。

# robots.txt の役割

クロールの最適化を行う
公開しないページのインデックス登録を防ぐ
重要なコンテンツを優先的にクロールさせる

# 基本構造

User-agent: [クローラー名]
Disallow: [アクセス禁止にするパス]
Allow: [アクセスを許可するパス]

記述例	説明
`User-agent: *`	すべてのクローラ
`User-agent: Googlebot`	Google
`User-agent: bingbot`	Bing
`User-agent: baidu`	百度（バイドゥ）

# よく使われる例

User-agent: *
Disallow: /admin/
Disallow: /search/
Disallow: /*.webm
Disallow: /*.mp4
Disallow: /*.wmv

Disallow なしになっているので、すべてのサイトを許可するようになります。

# Youtube の robots.txt

# robots.txt file for YouTube
# Created in the distant future (the year 2000) after
# the robotic uprising of the mid 90's which wiped out all humans.

User-agent: Mediapartners-Google*
Disallow:

User-agent: *
Disallow: /api/
Disallow: /comment
Disallow: /feeds/videos.xml
Disallow: /get_video
Disallow: /get_video_info
Disallow: /get_midroll_info
Disallow: /live_chat
Disallow: /login
Disallow: /qr
Disallow: /results
Disallow: /signup
Disallow: /t/terms
Disallow: /timedtext_video
Disallow: /verify_age
Disallow: /watch_ajax
Disallow: /watch_fragments_ajax
Disallow: /watch_popup
Disallow: /watch_queue_ajax
Disallow: /youtubei/

Sitemap: https://www.youtube.com/sitemaps/sitemap.xml
Sitemap: https://www.youtube.com/product/sitemap.xml

# 参考

2024-12-08 1年前

server

同じタグを持つ記事をピックアップしました。

# robots.txt の書き方

# robots.txt の役割

# 基本構造

# よく使われる例

# Youtube の robots.txt

# 参考

関連記事

Laravel Address already in use の原因

AWS 504 Gateway Timeout エラー完全解決ガイド

Amazon Linux 2 の amazon-linux-extras 完全ガイド

デプロイツール Capistrano

AWS CloudWatch ログ監視で Lambda 処理

Amazon DynamoDB 制限調査

AWS Elastic Beanstalk php.ini 設定変更

Elastic Beanstalk \$\SERVER['REMOTEADDR'] 取得できない

AWS Elastic Beanstalk 環境設定

AWS Unresolved resource dependencies [AWSEBV2LoadBalancer] エラー解決方法

AWS のタイムゾーンを UTC 協定世界時から JST 日本標準時に変更

Centos7 Webserver 構築の時のメモ

content-security-policy 設定

AWS SES メール開封確認 DB に集計

Shell と Bash のいろいろ

crontab 設定いろいろ

ディスク容量を確認する df コマンド

DDNS 無料ダイナミック DNS サービス 4 つ徹底比較

Docker command でドッカー練習する時のメモ

Windows10 Home に Docker 入れた時のメモ

Docker の基本的な使い方

Windows Mac Linux hosts ファイル場所

ジェネレーティブ AI と大規模言語モデル（LLM）を学ぶためのリソース

メールサーバー移行と POP & IMAP 設定

自宅サーバー構築！ Nextcloud で NAS クラウドストレージ

Nginx web サーバーのセキュリティ

VPS サーバーのセキュリティ対策：fail2ban 導入完全ガイド

積水ハウス 個人情報流出 SQL インジェクション攻撃か

Nginx 基本設定

SPF メール送信なりすまし対策

Mac ターミナル SSH 接続設定

PM2 のエラーを Slack に通知

Ubuntu サーバー初期設定手順

Vim 操作とショートカット

Ubuntu で Web サーバーを構築する手順

Ubuntu 24 nginx サーバー 522 エラー原因調査手順

5 分で VPN サーバーを構築! wg-easy の使い方

ShadowsocksR で VPN サーバーを構築する方法

解決! xserver php バージョンアップした時に ssh 環境に反映されない

xserver に Node.js インストール

xserver に vim インストール

XZ Utils 事件対応

レンタルサーバーなら xserver おすすめ理由

ZeroSSL で無料 SSL できるけど Let's Encrypt と比較

よく使う WSL コマンド

WSL2 Ubuntu で zsh の Docker 補完エラー解決方法

oh my zsh 使うべし

スクレイピング防止方法

Docker Supervisor 使ってバッチ処理

AWS SES メール開封確認　 DB に集計

自宅サーバー構築！　 Nextcloud で NAS クラウドストレージ

積水ハウス個人情報流出 SQL インジェクション攻撃か