N-blog (ネブログ)

アクセスカウンタ

zoom RSS 『ぶろっくやっちゃうよ君』が選んだ! 4万人のネトウヨ・レイシストAWARDs2015

<<   作成日時 : 2015/12/29 21:52   >>

面白い ブログ気持玉 4 / トラックバック 0 / コメント 0

 BlogよりもTwitterに馴染んでしまってここの更新を1年以上放置していたけれども、年の瀬ですし、そのTwitterで議論(煽り合い)の中心となった事態について、一つまとまった記事をこちらでまとめることにしました。結構手間をかけた分析なので、本当は論文調の同人誌を発行してどこかに委託したかったのだけれど、さすがにそんな時間はとれなかったので、こちらで煽情的なタイトルをつけて投稿します。

はじめに

 本当に最重要課題だったかはともかく、この2015年の日本政治においてもっとも騒ぎになったのは「平和安全保障法」の関連議論で、なかでも反対派の学生組織SEALDs (自由と民主主義のための学生緊急行動: Students Emergency Action for Liberal Democracy-s)は、マスメディアの寵児になりました。しかし「学生たちの自発的な行動」といっても、それを支持する大人たちの顔ぶれは「あー」と嘆息するようなもので、そういった界隈がTwitterで利用している『ぶろっくやっちゃうよ君』を、SEALDs公式アカウントもまた適用していることが発覚したことは、「いつか来た道」-70年前でなく45年前の-を思わせるような出来事でした。

 さてひとまず『ぶろっくやっちゃうよ君』の説明を。もともとTwitterには「ブロック機能」があり、気に入らない/嫌がらせをする相手との関わりを遮断することができます。その作業は個々のユーザがおこなうものですが、嫌がらせをするような悪意あるアカウントはわりと固定していますから、そのリストをユーザ間で共有してしまおうという意図で、Twitterの元エンジニアが開発したのが"Block Together"です。『ぶろっくやっちゃうよ君』はそこに登録されているブロックリストの一つで、本来の目的は反ファシズム・反レイシズムの運動をしている人たちが、嫌がらせをしてくる「ネトウヨ・レイシスト」を前もって遮断してしまおう、というものです。

 もちろん嫌がらせや罵詈雑言を送りつける悪意のあるアカウントがあることは事実でしょう。しかし『ぶろっくやっちゃうよ君』の問題はその数。話題になりはじめた10月頃にはリスト入りアカウントは4万件に達しており、中には芸能人・企業の公式アカウントなども含まれていることが発覚しました(参照『ぶろっくやっちゃうよ君に「レイシスト・ネトウヨ」と認定された人々』)。
 それに関して運用側から見解が出されましたが(参照『ぶろっくやっちゃうよ君のブロックリスト入り基準について』)、反対者と対話を試みた仲間さえ巻き込みでブロックしてしまうような雑なリストを、SEALDsのような団体が適用していることに対しては同じ左派である高島章弁護士や同じく弁護士のモトケン氏などからも批判が相次ぎました(参照『“人権派”弁護士の高島章先生「残念だが、SEALDsを民主主義の敵と規定せざるを得ない」』)。

 この高島章弁護士の批判(および『はすみリスト』事件)から発生した椿事は、他のまとめサイトなどに譲るとして、私が着目したのは『ぶろっくやっちゃうよ君』の「数」そのもの。"Block Together"がTwitter APIを利用して開発されたように、『ぶろっくやっちゃうよ君』に登録されているアカウントの活動状況をプログラムにより自動的に調査することは十分に可能です。
 Twitter社が公開している"Twitter Developers"で取得したアプリのコードを、Microsoftがフリーで提供している"Visual Studio"で組んだC#プログラムに埋め込み、読み出し結果を同じくMicrosoftの"SQL Server"でデータベース化する。この手法は全て公開可能(取得データ自体はおいといて)であり、セキュリティ企業や新聞社など職務上の権限によって得られるような機密情報は一切ありません。取得後のデータ分析にある程度の恣意性が混じることは否定できませんが、4万件もある以上、「数」として平滑化できるでしょう。

ブロックリストの全体像

 データ取得は、2015年11月2日から11月6日にかけて行いました。手順は以下のとおり。
A) 11月2日の午前1時時点での"Block Together"内『ぶろっくやっちゃうよ君』から取得したUserID(ユーザ側で変更不可能な固有の数字。@xxxとユーザが名乗るものはScreenNameという)のリストを取得する。
B) 上記リストのUserIDを、作成したプログラムでAPIにて一つずつ呼び出し、そのアカウント情報(ScreenName, 名前, フォロー, フォロワー数等)をデータベースのテーブルに追加する。
C) 同時にそのIDの直近20ツイートの本文と投稿時間を取得し、データベースの別のテーブルに追加する。

 調査期間に幅があるのは、Twitter APIの仕様が15分間で180件、つまり5秒間に1件に制限されており、4万件あれば終夜稼働でも二日半を要するものを、バグ修正も並行して行ったためです。結果として

・ 39,006件のアカウント
・ 675,036件のツイート

を取得しました。これまでさんざん4万件と言ってきたのにそれを割っているのは、UserIDが一緒ながら"ScreenName"(たとえば私なら@enu_ei )だけを変更したのが二重登録されている可能性と、リスト取得時のこちら側のミスの可能性があり、どちらかといえば大半が後者です。本当は副アカウントに「ぶろっくやっちゃうよ君」を適用させて、そこからTwitter本社が今年6月から実装したブロックリストのエクスポート機能を使うつもりだったのですが、これでダウンロードされるCSVファイルは1個あたり5000件で、4万件なら8個作成されるものの実は内容が全部一緒、というバグがあることが発覚したのです。これはTwitter本社のやる気のなさもさることながら、ブロックを共有するにしてもせいぜい5000件程度だろう、という見通しがあったと思われます(2015/12/29現在も修正されていません)。

 さて、アカウントの中には非公開(通称・鍵付き)、凍結・消去済のものがあります。鍵付きアカウントははプロフィールが取得できるもののツイートを取得できないし、凍結・消去済アカウントは両方とも取得できません。さらにツイート数が20件未満の場合は、副垢であったり急遽ツイートを消去したりした可能性があります。さらにアカウントが生きていても、休眠状態のアカウントもありますから、そういった情報を踏まえ、アカウントを以下のように区分します。

1. 鍵付き(非公開)
2. 凍結・消去済
3. Tweet実績20未満(副垢)
4. 100日以上Tweetなし(休眠状態)
5. 活動実績があるユーザ
6. 24時間以内に20tweetsしているユーザ(ツイ廃)

 前述したように、APIの都合でユーザ毎に情報取得の時刻が異なりますから、100日以上実績なし、という判断は正確には揃いません。そのため4と5の区別は、SEALDsがらみのリストですから、平和安全法制が衆議院で可決された7月15日を起点としています。また6は、20件のTweetの最初と最後の時間差をとって判別しています。結果として、活動しているアカウントは約7割であることが確認できました(下図)。
画像

 いっぽう、全アカウントに対し、フォロー・フォロワー数を散布図にしたものが下図です。横軸がフォローされている数、縦軸がフォロー数で、両対数表示にしています。個人的には、この散布図で「一般枠」「企業公式の類」「フォロー数を抑えているご意見番枠」といった傾向が見えると踏んでいたのですが、多くのアカウントが「フォローされるとフォロー返しをする」というTwitterの初期マナーを踏襲しているようで、手間をかけた割にはさほど面白いグラフになりませんでした。ちなみに各カテゴリの平均像を、中央値で表示しています(平均値は上位に引っ張られてかけ離れるため)。ちなみに全数の中央値ではフォロワー数678、フォロー数923となります。
画像


どんな傾向の人がブロックされているのか

 ここからはツイート内容やBioなどから、ブロックリストの思想傾向などを分析することになります。こういったことは本来、社会学的な訓練を受けた人がテキストマイニングなどの手法でやるべきなのでしょうが、先行研究である田村貴紀氏の『SEALDs という単語を含むTwitter記事をテキストマイニング(1)』による単語抽出結果を参考にしながら、こちらが思いつく範囲の単語を検索し、アカウントごとに採点していきました。

 たとえばTweetから「SEALDs」「民主党」といった単語を抽出したとき、政治には関心がありそうだと判断できますが、その対象に否定的か肯定的かまでの文脈ははっきりしません。あとで単語リストを示しますが、そういう単語が抽出されたアカウントには「政治点」を1点追加していきます。
 一方で「サヨク」「売国」といった単語が抽出されたら、反レイシズムやSEALDs界隈に批判的・嘲笑的であることが明確と判断できますから、「ネトウヨ・レイシスト点」を1点追加します。またBio(自己紹介)欄で「愛国」「嫌韓」などの単語が抽出されたら、たまたま抽出したTweetの時期が別の話題で盛り上がっていても「ネトウヨ・レイシスト」と判定できましょうから、こちらは特別に2点を加えます。
 最後に、本来の『ぶろっくやっちゃうよ君』の目的であるはずの、Spamや嫌がらせをしているアカウントを判断するために単語を抽出します。田村氏の研究で「婚活」「招待」といった言葉がスパムと判定されていたのを怪訝に思っていたのですが、実際に抽出してみると、そういったハッシュタグをつけたスパム文がたくさん見つかりますので、「SEX」「セフレ」といった卑猥な言葉も一緒に「Spam・嫌がらせ点」として1点追加します。もちろん一般の人が「婚活パーティに招待されたけど面倒」とTweetする場合もありえるのですが、これでも「Spam・嫌がらせ点」として2点入ることになります。

 というわけで、この三種類のポイントから、アカウントを区分します。「婚活パーティ」だけでもスパム点が入ってしまうことなどを考慮して基準を3点以上とし、「政治点が3点以上だがネトウヨ・レイシストや嫌がらせ的な発言はない層」「ネトウヨ・レイシスト点が3点以上あるがそれ以外は3点未満の層」「ネトウヨ・レイシスト点および政治点が3点以上だが嫌がらせ的発言はない層」「Spam・嫌がらせ点が3点以上ある層」を円グラフにしたのが下の図です。
画像

 繰り返し述べたようにツイート取得には時間差がありますから、たまたまその時間帯に他の話題で盛り上がっていた人もいるだろうとはいえ、『ぶろっくやっちゃうよ君』のアカウントの中でノンポリ層は6割を越えます。一方で、本来の「Spam・嫌がらせ層」はかなり厳しめに見ても8%、3000アカウント弱ですから、Twitter公式仕様(バグ)である「ブロック共有リストは5000件まで」というのは割と実態に合っている、と言えるかもしれません。
 ちなみに単語リストとその抽出件数は以下のとおりです。かなり差別的な言葉も混じっていますので拡大時はご注意ください。
画像

 さらに、どんなアカウントがリツイート、もしくは@ツイートされているか、ランク付けしたのが下の表です。黄色で示した名前は同じくブロックされているアカウント。総数の他に、先ほど区分した「ノンポリ層」「政治層」「ネトウヨ層」それぞれの参照数を追加しています。合計が合わないのは「Spam・嫌がらせ層」を抜いているためで、600くらい数がずれる有田芳生議員は、かなり嫌がらせを受けている、とも言えそうです。
画像


認証された「ネトウヨ・レイシスト」

 最後のデータとして、『ぶろっくやっちゃうよ君』がブロックしている約4万件のアカウントの中で、Twitterの公式認証があるアカウント(APIから"Verified"というフラグを取得できる)を抜き出した結果を示します。下の表は84件の認証アカウントを、フォロワー数の多い順に並べたものです。もともと公人格を認証されているアカウントを「ネトウヨ・レイシスト」という枠でブロックしている、ということ自体がおかしいのですが、タカ派である次世代の党(調査時の名前)や幸福実現党所の議員・候補をブロックするのはまあ理解できなくないとしても、それ以外はとんでもないことになっています。
画像

 岩上安身・小沢一郎・「生活の党と山本太郎となかまたち」をブロックしているのは党派性が透けて見えるし、朝日新聞記者は「巻込まれ」型だと予想されます。もともと朝日新聞社は記者の公式認証を積極的にとる方針であるから目立っているだけで、公式認証をとっていないでブロックされている記者もいることでしょう。
 さらにブロックリスト入りの経緯が全く不可解なのはCrash Midnight, NightShadeといった海外のロックバンド。反レイシズムの主要メンバーに音楽関係者がいるとのことですが、何か音楽性の違いでもあるのでしょうか。そして海外政府機関として、米国魚類野生生物局および韓国青瓦台(大統領府)がリスト入りしているのは、もはや喜劇といえるでしょう。

さいごに

 煽り目的とはいえ、せっかく表題にAWARDsとつけたのだから、何らかの表彰をしましょう。相撲の表彰にならい、技能賞・敢闘賞・殊勲賞の三賞、そして最後に最優秀ネトウヨ・レイシスト賞を発表します。あまり個人攻撃をする意図はありませんから、今回の『ぶろっくやっちゃうよ君』調査の中で発見した、できるだけ公人格のあるアカウントなどを対象とします。

技能賞: Twitter公式『より安心して利用できる環境のためにブロックリストを共有できるようにしました』 (https://blog.twitter.com/ja/2015/0610block)
 "Block Together"が2014年10月に発表されたのに後んじて、2015年6月10日に実装された公式機能。"Block Together"がリスト更新を定期的にアカウントに反映させているのに対し、Twitter公式機能は「ブロックリストをCSVファイルにインポート/エクスポートできる。できたCSVファイルの交換はユーザ間で適当にやってください」というものですから、ネットワークの負荷を想像すると圧倒的に公式が優位。「5,000アカウント以上のブロックリストの場合、リストは複数のファイルに分割される。」という表記も、分割されるのは事実なのだから嘘ではありません。
 Favボタンを「いいね」に変更したこと代表される、様々な迷走があった2015年のTwitter。ブロックリストを4万件共有する、なんてことも想定外のことだったでしょうが、ヘビーユーザである日本人の特徴をうまく把握して、来年こそ巻き返しにつなげていただきたいものです。

敢闘賞: 田母神俊雄 (@toshio_tamogami)
 言わずと知れた元航空幕僚長。おそらくこの人をフォローすることが、ブロックリスト入りの登竜門となっていると予想されます。26万を越えるフォロワーを抱えながら、自らのフォロー数は永遠のゼロ。このストイックさも高評価です。

殊勲賞: YouTube (@YouTube)
 『ぶろっくやっちゃうよ君』登録者がRT, @ツイートしているアカウントの中でダントツの1位。「犯罪者の98%はパンを食べている」というやつです。もちろんこのアカウントは『ぶろっくやっちゃうよ君』の対象外です。

最優秀ネトウヨ・レイシスト賞: US Fish and Wildlife (@USFWS 米国魚類野生生物局)
 米国内務省内にある、野生動物の保護管理を専門に行う組織。認証アカウントにして海外政府機関、として韓国青瓦台(@bluehousekorea)と争いましたが、インパクトの次にくる「よりにもよってそんなところを」という後味で上回りました。『ぶろっくやっちゃうよ君』がブロックしている「ネトウヨ・レイシスト」の中で、最強のアカウントです。アメリカの大自然を堪能できますので、年越しのお供になさってください。『ぶろっくやっちゃうよ君』を使用していない人限定となりますけれども。

テーマ

関連テーマ 一覧


月別リンク

ブログ気持玉

クリックして気持ちを伝えよう!
ログインしてクリックすれば、自分のブログへのリンクが付きます。
→ログインへ
気持玉数 : 4
面白い 面白い 面白い
驚いた

トラックバック(0件)

タイトル (本文) ブログ名/日時

トラックバック用URL help


自分のブログにトラックバック記事作成(会員用) help

タイトル
本 文

コメント(0件)

内 容 ニックネーム/日時

コメントする help

ニックネーム
本 文
『ぶろっくやっちゃうよ君』が選んだ! 4万人のネトウヨ・レイシストAWARDs2015 N-blog (ネブログ)/BIGLOBEウェブリブログ
文字サイズ:       閉じる