スパムコメントのボーダーライン

先日メーカ反乱の狼煙かというエントリにこんなコメントが入った。

 お久し振りです。
今日はちょっと宣伝に来ました。
実は 1/21 から「裸言-LAGON-」
http://lagon.jp/
というサイトを立ち上げる事にしました。
コンセプトは「言葉のエンターテイメント」です。
頑張りますのでどうぞ宜しくお願いします。

この御仁からは過去に2回ほどエントリとはほとんど関係ない主旨のコメントを頂いている。ただ、前のはさらっとではあるがエントリ内容に触れていた。めくじら立てる事もないだろうというレベルかもしれない。だが、これは一般的にスパムコメントと認定される類であることははっきりと述べておく。違う方にもさりげなく指摘されているし。

では、どのようなものがスパムコメントというかであるが、このあたりの判定基準ははてなダイアリーコメント・トラックバックスパム対策が俺の考えに近く、そして非常に明確に書かれているので参考になるだろう。この最初に

コメント・トラックバックスパムとは、スパムメール(迷惑メール)と同様、自分のサイトの宣伝などのために、内容と無関係のコメントやトラックバックを大量に送りつける行為の事を指します。

とある。上記コメントは「大量に」の部分を除いてまさにそれである。どの程度から「大量」というかは不明であるが、Yahooで検索するとそれなりに引っかかるので、数量の面から言ってもスパムだろう。

以下は一般論だが、スクリプトなどで送りつけられるスパムは送り手がスパムと認識して送っているだろうから心おきなく削除できる。問題は、送り主がスパムと認識していない場合である。もしかしたら今回のケースはそうなのかもしれない。悪気が無いだけでなく、人の役に立つと思って宣伝しているとなればなおさら重傷である。そういう人にスパムの蘊蓄を語っても無駄であろう。ただ、よく考えてほしいのは、実社会で他人の家の壁に断りもなしにチラシを貼り付けていく行為をどう考えるのか、である。「もし自分の家の壁に無断でチラシを貼られたり落書きされたら」という想像力は働かないのであろうか。

上記コメントについての言及に戻るが、この御仁は自分のサイトの宣伝だけのために俺のサイトを使った。その目的をさらに効果的にするべく、俺はそのコメントをネタにしてトップにURLが表示されるようにしてみた。このエントリはそれだけのものである。

ネットワーキング鼻つまみ者度自己採点

Open Tech Press | ソーシャルネットワーキングで鼻つまみ者にされる11種類の行為
この記事はSNSの事として書いてあるのだけれど、ネットワーキング一般にも十分当てはまる。この記事を読みながら自分を自己採点してみよう。各項目該当度合100%を100満点として、合計点数/11で採点してみる。
1.他の企業や個人の中傷に走る
70点 特に多いのがMS社に対する文句だけど、基本的に文句が多い人間なんでね・・・。ふん、悪かったな。

2.許可なく第三者の名前を持ち出す
10点 ごくまれに名前を出すことはあるが、それは比較的有名な人だけで一般の個人名などは出したことが無い。つか、出すのはアホのやることでしょ、普通。

3.自分の人脈を誇張して語る
0点 もともと誇張できる人脈さえ無いよ(泣)。

4.露骨な求職活動を展開する
0点 求職活動ね・・・考えたこともなかったな。

5.相手からの返答をスパムメールのごとく求める
0点 コメントを返すのもおっくうな時さえある俺です。それよりエントリと関係ないコメントとかを抹消したくなる俺ですがそれが何か。

6.ネットワーキング活動を消極的なものでお茶を濁す
0点 これはちょっと意味がわかりませんので0点とさせていただきます、かしこ。

7.ネットワーキング世界で求められた要請に考えなしで応じる
0点 要請されたことさえないです。(^O^)/

8.交友関係の維持に心を尽くさない
100点 交友関係は置いといて(^^)(/^^)/って感じですかね。なんだか悲しくなってきた。

9.他人の時間を無駄にさせても何ら気に病まない
100点 他人の時間の使いかたも(^^)(/^^)/。時間を無駄にする奴が悪いと思うぞ。つか、強要したこともないしー。

10.交友関係を壊しかねない行為に走る
0点 交友関係0なんですが。

11.一方通行的なネットワーキングの使用法をする
100点 ネットは基本的に一方通行です(キッパリ)。タイムラグのあるのは双方向通信って言わないと思う。

合計380点 平均34.5点。

鼻つまみ度けっこうありかな。人によっては匂っているかもしれんね。

日本語ドメインって意味あるの?

昨日付けの朝日の記事にHPアドレス「.日本」もOK 09年にも各国語解禁ってのがあった。日本語ドメインは既に解禁されていたんだけど、この「どっとじぇーぴー」って部分も日本語可能になるらしい。

ものすごく意味ない事のように感じるのは俺だけ?

まず朝日の記事からだけど、

日本語変換を切り替えずに済むため、入力が簡単になる。

なんてありますが、「あさひしんぶん.にほん」を変換すると「朝日新聞。日本」になるんだよ、普通は。はい404決定(サーバが見付からないんだから、本当は404じゃない)。2008/01/12訂正 各国の「.」にあたると思われる文字を「.」としてつかうことができます。とのコメントをいただきましたので訂正。ありがとうございました。「。」と「.」の違いは気がつくかもしれないけど、「.(全角)」と「.(半角)」の違いは気がつかない人も多いぞ。ただでさえ半角と全角の意味がわからん奴が多いんだからさぁ。いらぬ混乱を招きそうだけどね。

それから、根本的な話として、ダイレクトにドメインを入力する人っているのかって事だね。大体は検索エンジンもしくはどこかのページからのリンクで飛んでくるわけで、その場合ドメイン名なんてはっきり言えばどうでもいい。あなたは知人のブログの正式なURLやドメイン名知っていますか?

そして、最大の問題点は文字コード。日本語でドメインを表記する場合、見た目は日本語でも内部コードにすれば数種類あるわけだよ。このサイトはUTF-8だし、PCUnixで広く使われていたのはEUC、そしてJIS、ShiftJISなど、有名どころでも4種類ある。どのコードでドメインを入力するかは端末次第なわけで、コードが一致しなきゃこれまた「そんなサーバ無いです」になるよね。

ここいらへんの対応については日本語ドメインのサイトの対応環境についてというページで説明されているけれど、圧倒的シェアを誇るであろうIE5及びIE6は日本語ドメイン名プラグイン(i-Nav)や、あのJWordプラグインが必要らしい。スパイウエアかウイルスかと騒がれたJwordを推奨しているのも驚きだけれど、プラグインを推奨しているって事は文字コード変換に係わる問題は実際に発生しているって事だね。

海外から日本語ドメインのサイトにアクセスするにはどうすりゃいいのさ。全然ワールドワイドウェブ(WWW)になってないってことですね。

・・・(黙)

なんだか意味ないよね、これ。

無料ブログサービスに不満を言うのは変

ほとんどの人は無料ブログサービスを利用してブログを開設していると思うが、無料ブログサービスはそのビジネスモデル上、ユーザを多数集めなければ成り立たないというのは少し考えればわかる。多数の人間が使うインフラであれば、当然それなりの投資額が必要になってくる。サービスレベルと投資額は反比例するだろうから、サービスレベルをどのレベルでよしとするかは運営サイドの考えひとつだ。無論、損をしてまでサービスを提供することなど有り得ない。そんな無料ブログサービスであるから、万人が不満なく使えるなんてまずあり得ないのは当然の話。

無料ブログサービスへの不満は「遅い」というのが一番であろう。その他の不満としては「スパム対策が弱い」などがあると思うが、「遅い」という不満に比べたら微々たるものではないかと思う。投資面から言えばピークの負荷にシステムを合わせるのは無駄が多いので、アクセスが集中する時間(多分22:00~1:00くらい)は遅くなって当り前だ。利用者が多いときに遅くなるのだから、不満に感じる人も利用者数に比例して多くなる。ただ、それはピーク時間だけの話だろう。また、ユーザ数アップのために、必要以上に機能が追加されていることも遅さに拍車をかけているのは間違いない。

俺が疑問に思うのは、不満があるのになぜそのまま使いつづけるのかということだ。それも無料にもかかわらず、なぜ文句を言うのか理解できない。不満が大きいのであればさっさと乗り換えればいい。それ以上に、なぜ制限の多いブログサービスを使うのかよくわからないのだ。他人ばかり当てにせず、自分でやったらいいのにといつも思う。

自前でサーバを用意するのは、ある程度知識がないと難しい面もある。しかし、その困難分の見返りはあると思う。同一ブログサービスメンバーのコミュニケーションに依存していないのであれば、なおさら自前のサーバへの乗り換えはやりやすいはずだ。自分のサーバなら機能強化や不必要な機能の停止なども自由自在(スキルがあれば)である。はてなブックマークのコメントとかネットイナゴを毛嫌いしている人などは、ぜひ自前でサーバを運営して不満を自分で解決してもらいたいものだと思うのだが、いかがだろうか。

アメーバブログのRSSのURLが変わってる

ありえないくらい貯りに貯っているRSSリーダの未読。20000近くあるんだけどどうすればいいのと思いながらつらつら眺めていると、登録してもいない「スタッフブログ アメーバブログからのお知らせです」なんて記事を発見。なんじゃこりゃぁと松田優作ばりにつぶやきながらリンク先をクリックすると
アメーバブログのRSSをご登録いただくサービスについて|スタッフブログ
なるページにジャンプしますた。ほほう、

昨日より、予定しておりましたアメーバブログのRSS変更 に伴い、お使いいただいている皆様から設定変更方法に関するお問い合わせを多くいただいておりますので、ご案内させていただきます。
・・・
[中略]
・・・
アメーバブログのRSSのURLは上記のように変更されておりますが、RSSの情報を利用しているサービスでは、ご自身で設定変更する必要がございます。以前の旧URLでは、RSS情報が配信されないため、誠に恐れ入りますが上記の通り新しいURLに設定変更いただきますようお願いいたします。

ですか。自分で変えなきゃだめなのね。

「ブログの負荷削減と安定性向上のため」のRSSドメイン変更(【重要】RSSドメインの変更について 参照)のようです。コメントにもありますが、こんなの301を返すような設定にすればいいだけじゃないのかと思うのですが、それをやらないというのは何か別の目的があるんでしょうね。つまり、今までどおり取得されちゃまずいんですよ。だから手動再登録にしてると考えるべきでしょう。

<棒読み>手動で再登録させることで一時期的に自動的にRSSを拾わせるようなところからの負荷は減るでしょうから、一時期的には負荷削減の目的は達成ですねよかったですね。管理側の一時期的対策としてはいいんじゃないですか。

ユーザからは不満の声が結構あがっているようですが、がんばってくださいね。</棒読み>

繋がらなくてスマソ

いや、また繋がらなかったようで・・・

といいつつ、こちらではリンク切れのログはあるんですが、アクセスされたからログを記録できるのであって、アクセスされなかったものをログにするのは根本的に不可能です(あたりまえだ)。apacheのログを眺めていましたが、指摘のあった16:46前後も何事もなかったかのようにYahooのロボットとかのログが残っているなど、回線やサーバがおかしくなっていたなんて痕跡はないので困っちゃう。

ただ、最近の不調は「家庭内乱内LAN」ケーブルの断線という、まったく笑えないオチだったわけですが、LANケーブルを変えてから、ADSLのリンク切れがまたまた増加しつつあるような感じです。一日に一回はリンク切れしてます。DNS更新がいきわたるタイムラグの間は、このサーバは世界から消えちゃう。困ったもんだ。

で、30分おきの友人宅サーバからの読み込みテストですが、12月3日は1:30に53秒かかっているのが最高で、それ以外はすべて30秒以内で完了しています。目視だけですが平均して10秒弱ってところじゃないでしょうか。しかしリンク切れもしていないのに53秒って、原因はなんだろう。友人が回線をバリバリ使っていたのかなぁ。だけどアイツんち光だし・・・

このサイト、もともとメインのカラムの表示は比較的速く出るんじゃないかと思います。実際NucleusはプラグインやJavascriptなどを多用しない場合はかなり速く表示されます。メインカラムにはそういう制御があまり絡まないので表示は速いはずです。遅いのは右カラムなんですが、まぁ、これは本文に目を通しているうちに表示されるでしょうからということで・・・

いずれにせよ、もはやサーバの設定ではどうしようもない感じですね。プロバイダや回線を変えるのが抜本的な解決方法に近いのでしょうが、それを除いて考えられる対策としては、リンクIPアドレスのチェックの頻度を上げるくらいしかないですな。

つか、今回のご指摘「サーバーから応答がない」というのは、ほぼ100%DNS更新の遅れによるものでしょう。同時刻にほかのところからはアクセスがあるのですから、このサーバが悪いんじゃないことだけはいまだがんばっているSocket7のK6-2に免じてみとめてあげてくだせぇお代官様。

このサイトの諸事情

先日通りすがりのおせっかいさんから、下記のようなコメントをいただきました。回答も兼ねてエントリしましょう。

ときどき立ち寄ろうとしますが,
1.接続が拒否される
2.パスワードを聞いてくる

などが頻繁におこっていますよ.サーバの設定がおかしいのでは.
オーバーフローが起こるほどアクセス数は多くはないサイトなので...

リンク切れが多発していたころは、接続が拒否されたりパスワードを聞いてきたりする状況になったことが多々ありました。最近はADSLのリンク切れも非常に少なくなって、数日に1回程度にまで落ち着いてきている状況です。勤務先やW-ZERO3で一時間に一回程度アクセスしてみてはおりますが、つながらないという状況はほとんどなく、頻繁につながらないという状況は確認出来ておりません。ただ、自宅にいるときは確認していないので、夜中の状況は確認していません。よって、今後は友人宅サーバからこのサーバの状況を定期的にチェックさせ、サイト表示に30秒以上かかるようであれば携帯にメールが入るように設定しました。ただ、テキストのみの取得でチェックしますので、右カラム表示の状況までは判断していません。

このサイト、ロボットも含めると一日平均6000くらいのページビューなのですが、11月25日の日曜日は2500弱しかありませんでした。週末(土、日、祝および学校の休みなど)にアクセスが落ちる傾向があるので「極端な日もあるんだな」と思っていたのですが、ログを調べてみると25日早朝にADSLリンク切れが発生し、その後ネームサーバが応答せずoyajiman.netのDNS更新に失敗していたようです。昔から使っているoyajiman.minidns.netのDNS更新はおこなわれており、そちらからのアクセスはカウントされていたため気がつきませんでした。

また、最近どういうわけか自宅からのネットアクセスがおかしくなるときがあります。自宅から外につながらなくなってしまうのです。一番疑うべきは家の中の配線なんですが、ADSLモデムをリセットすると回復する事が多いので、ODN自体の回線状況の悪化もしくは可能性としては低いですがモデム不調によるものと思われます。回線状況が原因か否かも、友人宅サーバからの調査でわかると思います。回線の品質が原因であった場合の対策としては、プロバイダを変えるか光に変えるしかなさそうです。プロバイダからもらうメールやコスト面から、今のところプロパイダや回線の変更は考えていません。もうすこし様子を見て行きたいと思います。

接続が拒否されるのは、真面目にアクセス集中です(多分)。サーバが見つからないとくればDNS更新されていない状況ですが。そんなに回線が速いわけではないですし、サーバもpoor、それに以前DDoS攻撃で大量のスワップ書き出しが発生し何度かサーバ応答なし状態に追い込まれたので、搭載メモリとのバランスを取って、同時にアクセスできるサイト数などをApacheのデフォルト設定から30%程度絞っております。行儀の悪いrobotや突然短時間に大量のリクエストを送ってくる所、スパムTBやスパムコメントを送ってくるところなどは、どういうわけか同じ時間に集中する傾向があるようです。一日たった150MBくらいの転送量しかないので、回線とサーバを変えるのはコスト的に見合わないなーと思っています。あ、膨大な数のRSS取得や嫁のネット利用なども影響しているかも・・・やはり光回線が必要なのかなぁ。猫の悪戯も考えられます(泣)。

パスワードを聞いてくるという現象は、DNS書き換えのタイムラグによって発生しているものと推測しています。これはリンク切れが多発していたころに俺も遭遇したことがあるのですが、見たことあるような文字が出ているなと思ったらモデムのログイン画面なんですよ。同じプロパイダですからADSLモデムも同じである可能性は高いです。プロパイダから割り当てられるIPアドレスは限りがあるので、ここのIPアドレスが変更されたら以前のIPアドレスはすぐにどこか違う回線に割り振られてしまうのでしょうね。つまり、このサイトにアクセスしたら全然違う所のADLSモデムが応答しちゃったという現象だと思います。通常ADSLモデムが外部からのアクセスに反応してログインのダイアログを出すことは無いと思うのですが、なにかいじっちゃってるんでしょうか。だけど俺のモデムじゃないのでどうしようもないです、ええ。

とまぁ、全然解決になっていないと言われちゃいそうな言い訳で、そんな言い訳していいわけ?なんておや自虐親父ギャグでもつぶやいていただければ幸いです。

などとさんざん言い訳を書いていた矢先、接続不可能な状態になりました。調べてみるとどうやら度重なる猫の悪戯でモデムとハブをつなぐLANケーブルが断線気味になっている模様。最近モデムの位置を変えリンク切れは減ったけど、こんどは家庭内断線ですかそうですか。ああ、やっぱり物理的な障害かよ(怒)。

LANケーブルは交換したので、これからは大丈夫?だと思いたいのですが、もう少し様子を見てみましょうね。

ReadMe!はどうしてしまったの

俺がとても参考にしていたReadMe! JAPAN – Top Pageの集計が止まっている。止まったのは10月27日あたりからで30日までは一部集計がされていたようだが、今はほぼ死亡状態。

トップページには

[10/29/2007] ●集計システムの機器故障の影響で10/27以降のランキングが正しく集計できていません。今後の対応については後日アナウンスします

とあるが、問題なのは一番下にある

管理人の呟き
(2007-10-29) どうやら年貢の納め時が来やがった…

って部分。ああ、ReadMe!なくなっちゃうんだろうか。まだアイコンは配信されているから少し希望はあるかもしれないけれど、管理人の気力が失せちゃっているような感じがして心配だ。

動作状況のグラフとか見ると、このくらいのトラフィックに耐えるようにするのって大変だろうなと思う。システムを外に出したら嫌がられるだろうし、自前で構築なんて金がかかり過ぎるし・・・過去の「管理人の呟き」でも、いろいろやろうとしたが途中で挫折みたいなメッセージがあったよなぁ。変にバイアスをかけないでドライにカウントするだけの情報って、ものすごく有用だったりするんだよね実は。

是非復活してもらいたいと思う。

「正解はCMのあと」と「続きを読む」は似ている

asahi.com:「正解はCMのあと」は逆効果 視聴者86%「不愉快」 – 文化・芸能

根本的な話をしちゃえば、CMを得るために番組がある日本に対し、番組を作ったりする資金のためにCM枠を売る海外ということなんだろうと思う。CM枠を売ることが最重要というスタンスが、盛り上がったところにCMを挟めばいいという安易な発想につながっているんだろう。

だが、CMだってそんなに悪いもんじゃない。まずその間にトイレに行ったり飲物や食べ物を用意したり新聞などで裏番組を調べたりできる。特にトイレの時間としては非常に有効で、これに慣れてしまうと映画館でもよおした時、「あ、CM無いんだ!」と慌ててしまうことになる。俺の場合は「あ、一時停止ないんだった」だけどね。

しかしこの山場CM、ブログで良く見かける「続きを読む」に似ているような気がしないでもない。盛り上がりの直前でこの「続きを読む」を見ると結構がっかりする。「続きを読む」をクリックすると別ウインドウで開いたりすることが多く、思考がとぎれてしまう。この「とぎれた感じ」がとても嫌なのである。特にブログってのは1ページに複数のエントリが載っているものがほとんどで、俺はそのエントリを一気に見てしまいたいのだ。だからその欲求を妨げるものはあまり好みでない。改行を多用するのも、盛り上がりを強調したいという意図であろう。改行の多用もあまり好みでは無いが、クリックするよりは思考がとぎれない。

実際「続きを読む」は余程気になった内容でなければクリックしない。もしかしたら書き手は山場を「続きを読む」以降に持っていって盛り上げようとしているのかもしれないが、俺みたいな奴にはその意図が伝わらないばかりか読まれていないのである。

タランティーノの「パルプフィクション」が世に出たとき、もったいぶったところのない展開にあっと言わされた。あのような突然の話の展開を味わってしまうと、もったいぶった作り方にじれったさを覚えてくるようになる。じらすのもテクニックのひとつであるが、「御利用は計画的に」とCMも教えてくれているじゃないか。

すわっ サーバダウン?

サーバを3代目に替えてから一年ちょっと。入れ替えてから通常運用で落ちることはほとんどなくなり、たまに落っこちるのは「不意にブレーカーが落ちる」時だけという安定ぶりです。そのブレーカー対策も、先日不意な停電に備えてUPSを購入したのでもうカンペキです。

しばし安心していたのですが、昨日の夜、突然サーバにつながらなくなりました。ADSLのリンク切れでDNS更新のタイムラグかなと思っていたのですが、いつまで経っても一向につながる気配がありません。待つこと30分、なぜか突然つながりましたが、リンクIPアドレスに変更はありません。これは、接続できなかったのはDNS更新のタイムラグが原因ではなく、なにかほかの原因でサーバにつながらなくなったということを意味します。

最初はDDos攻撃みたいなやつでアクセスが集中して過負荷になったのかなぁと思ったのですが、ApacheのLogにはアクセスが集中した形跡はありません。その他のログも見てみたのですが、なんといいますか、完全に接続が切れていたって感じなのです。

本当はここいらで「物理的要因」を考えなきゃならないのですが、いままでまともに動いていて突然つながらなくなるとなると、どうしても複雑系思考回路になってしまいます。まず最初にADSLモデムのNATを疑ったり、サーバ以外のPCがウィルスにやられちゃったんじゃないかとか・・・

で、結局はルータとLANケーブルの接触が悪くなっていたってことが原因だった模様。普通ルータとかケーブルなんてそんなにいじるものじゃないです。誰がいじったんだろと思ったら、どうも犯人は猫っぽいんですね。猫だから犯猫か。サーバも安定させ停電にも備えたのに、今度は猫にサーバとめられるんですね。しくしく。

これじゃまるでスパムじゃんか

昨日、自分のサイトを眺めていて変なものに気がついた。それは左の画像の赤線を引いた部分なんだが、Trackback Poepleになんだか怪しげなTBが入っている。それもご丁寧に[PR]なんて書いてあったりして、もう完全にSpamTBとしか言いようがない。

早速BlogPeolpeにいってこのTBを削除することにした。BlogPeopleにログインしてTrackback Poepleの管理画面を開いてみたが、それらしいTBは入っていない。何度みても結果は同じで、[PR]うんたら というTBはどこにもない。

ここで俺はハタと気がついた。

これってBlogPeopleが勝手に付けている奴とちゃいますか?

多分そうだ。だからご丁寧に[PR]と付けているに違いない。だけどこれっておかしいだろ。そんな話全然聞いていないし、Trackback Poepleは検索したときに出てくるGoogleAdsenseなんかとは全く違う類のものだ。GoogleAdsenseは検索結果に関連のあるものが表示されるけれど、自分で能動的に情報を収集した結果表示されるものだ。それに対しTrackback Poepleはユーザが登録していくようなもの。その中に作為的な広告を紛れ込ませるなんて言語道断だ。大元の管理者はBlogPeopleだけれど、このTrackback Poepleの管理者は俺だ。俺はこんなインチキTBは許可しない。カレーの中にうんこを入れるようなこの手法は余りにも姑息で容認できない。

BlogPeopleを運営している会社は、ここまでして広告収入を得なければならない状態なのか?なんだかもーである。

[2007年10月25日 追記]
あたしンちのおとうさんの独り言の「BlogPeopleが自身のサービスにスパム入力?」ってエントリでも述べられているけれど、このやりかたは腹立たしいというよりとても残念というのが正直な感想だ。色を変えるなりバナー表示を工夫するなりして、一目で広告とわかるようにして欲しかったよなぁ。ダマシや引っかけはよくないよ・・・