2024/07/07(日)よろしくないbotを弾く小話

この手の噺は何度も語りつくされてると思いますが、
「ここでは上手くいった」とか「これじゃ使えない」的なコメントがあるので、
定期的なアップデートと攻略が求められます。

...それにしてもmod_rewriteが動かん理由がわからん。
前まで動いてたんですが...エラーログでも見るか。

よろしくないbotはホワイトハウス送りだ!

と言う事で、今回はあまり行儀の良くないbotを弾くhtaccessなんぞの紹介をしたいと思います。
大抵の精査とか調査とかはいいんですが、
何かの裏口を探したり、phpファイルなんてないのにphpのファイルを探るマヌケがいるんですよ。
何がしたいかは言わずもがななんですが、こーゆー奴らは積極的に*破壊*してく方針ですので、
GPT先生にお伺いを立ててhtaccessを書いてもらいました。
# RewriteCond %{HTTP:Accept-Language} !ja [NC,OR]
# RewriteCond %{HTTP:Accept-Language} !en [NC,OR]
# RewriteCond %{HTTP:Accept-Language} ^$ [NC,OR]
RewriteCond %{HTTP_USER_AGENT} go-http-client [NC,OR]
RewriteCond %{HTTP_USER_AGENT} python-requests [NC,OR]
RewriteCond %{REQUEST_FILENAME} \.php$ [NC]
RewriteRule ^.*$ https://www.whitehouse.gov/ [R=302,L]
ついでだ、lang設定にjaかenを返さないbotは弾こう
クローラーには<<%HTTP:Accept-Language>>がないとの事なので、三行目を追加。
上二つの処理はすげえややこしいので無し(一応ぁぃぁぃ城の何かを作るときは有効)
現在このhtaceesはoinarisan.comと0xBF12にて実験運用しています。
「見れない」とか「この言語を追加してくれ」とかございましたら
例によって@isoplantへja-jpに対応した言語にて伝えてくだされば何とかします。

とりあえず運用してうまい具合に行けば良いですね。と。

火を吐く仏像(image creatorにて作成)