Loading...

2007年07月18日

ワードサラダ

最近ネット上で、支離滅裂な文章を掲載するブログをよく見かけるようになった。「ハンカチ王子が上がるとイソフラボンが投げ放題になるが、そのまま家系ラーメンを飛び込んだ」といった文章だ。このようなデタラメ文のことを、ワードサラダという。

詳細はこちら

ブログなどでスパム行為を働くのに有用であるため、ここ数年、広がったきた文章テクニックだ。ワードサラダを掲載するブログは、サイト検索エンジンのスパムフィルターにひっかかりにくい。この特性を利用して閲覧者をおびき寄せ、アフィリエイト事業者から手数料をかすめ取ることを目的としている。

そもそもワードサラダは「文法的には正しいものの、言葉の選び方が正しくないので、意味が通らない文章」のことをいう。例えば言語学者のノーム・チョムスキーが作成した文章「Colorless green ideas sleep furiously.」は、ワードサラダの具体例として有名だ。これを日本語に訳すと「色のない緑の概念が猛烈に眠る」ぐらいの意味になる。つまり、サラダの中にいろいろな野菜が散らばっているように、相関のない言葉が文章の中に散らばっている。精神医療の分野では、分裂症患者が話しがちな言葉として有名だ。

ワードサラダは、各種フィルターを通り抜けやすい
いっぽうインターネット分野では、このワードサラダがスパム行為の重要テクニックとして利用される。例えばワードサラダを記載したスパムメールは、迷惑メールフィルターを比較的容易にくぐり抜けてしまう。くぐり抜けた迷惑メールは、スパマーに何らかの利益をもたらす。

また、ワードサラダを掲載するブログ(スパムブログの一種とも考えられる)も増えている。ロボット型検索エンジンは、このようなブログがスパムであることに気付かないことが少なくない。検索エンジンを利用したユーザーが、何かの弾みでこのようなブログを目にしてアクセスすると、ユーザーのパソコンは、通販サイトのクッキーを自動保存してしまう(ブログを見ただけでは、ユーザーは、このブログと通販サイトとの関連性が分からない)。このユーザーが、後日、何も知らないまま通販サイトで買い物をすると、その販売手数料がブログの運営者に振り込まれる。もちろん通販サイトは、そのような形でのアフィリエイト(提携)を違反行為としている。

詳細はこちら

最近は、「言葉のサラダ」ではなく「文章のサラダ」と呼ぶべき応用手法も広がり始めた。例えば「年金問題」に関連した文章を、RSSを通じて自動的に収集。それらの文章を丸ごと勝手にブログに貼り付けて、記事(エントリー)をつくり出す。さらに「年金問題」に言及した他のブログに対してトラックバックを発信する。自動生成した記事は、一見すると年金問題の真面目な記事に見えるので、これがスパムブログであることに閲覧者は気付きにくい。だがブログ全体を見ると、掲載している文章の多くが「他のサイトからのコピー」であることに気付く。もちろんこのブロガーの目的も、アフィリエイトによる収入だ。

ワードサラダの手法を使ったスパムブログが蔓延し始めたのは、ここ数年のことだ。スパム対策の一般的な手法である「ベイジアンフィルター」(確率モデルによってスパムを判定する手法)を比較的容易にすり抜けることができるため、急速に普及したものと思われる。元々は英語圏のネット空間で蔓延した手法だったが、最近、日本語圏にも広がったようだ。

このようにスパムの分野では、日々新しい技術が登場している。そしてサイト検索エンジン、ブログ、アフィリエイトサイトなどのシステム開発者は、そのつど新しい対策を迫られる。スパマーと開発者のイタチごっこは、今後も激しさを増しながら続くことになりそうだ。

詳細はこちら
posted by yagoo at 20:34| 東京 霧| Comment(0) | TrackBack(0) | WEB | このブログの読者になる | 更新情報をチェックする
この記事へのコメント
コメントを書く
お名前:

メールアドレス:

ホームページアドレス:

コメント:

この記事へのトラックバックURL
http://blog.seesaa.jp/tb/48346516

この記事へのトラックバック
はてなRSSに追加
livedoor Readerに追加
My Yahoo!に追加
Googleに追加
goo RSSリーダーに追加
Bloglinesに追加
Technoratiに追加
PAIPOREADERに追加
newsgatorに追加
feedpathに追加
BBS7.COM
MENURNDNEXT