もう少しGoogle Trendsで遊んでみる

昨日の記事では後半にStarWarsの話に脱線してしまったわけだけれども、
実は、あの後ももう少し、Google Trendsで遊んでいた。
StarWarsの中の、僕のお気に入りキャラ、アクバー提督の検索数が
もう少し、上がる瞬間がないか、しつこく、やってみていた。

GoogleTrendsでの遊び方の紹介もかねて、やったことのキャプチャを残しておく。

【1】Google Trendsに入る
【2】地域を「日本」に設定する
【3】検索キーワードに、自分の興味のあるキーワードを入れてみる。今回はスターウォーズのキャラクター名を入れていく
【4】[+比較]を押すと、最大で5つまでのキーワードを比較できる。というわけで、スターウォーズのキャラクターを5名、並べてみる
※ 目的は、アクバー提督というニッチなキャラクターが、どこまで「ルーク」とか「ハン・ソロ」とかいったメジャーどころの名前に、検索トレンドで対抗できているかの調査となる。

青がルーク、赤がハン・ソロ、黄色がレイア姫、緑がカイロ・レン。そして紫色が、ターゲットの、アクバー提督である。
適当に並べた5名だが、すでに提督の完敗は明白。
『最後のジェダイ』に登場していないハン・ソロと、やっと互角である。
アクバー提督、『最後のジェダイ』にちゃんと登場したにも関わらず、、、。

それにしても、ふと気が付いた。
劇場公開中よりも、最近の、2018年4月に、カイロ・レンが爆発しているのは何だろう??

これは、色々調べてみて、なんとなく、わかってきた。
この時期にモンストとスターウォーズのコラボ企画があったらしい。
その流れの中で、「カイロ・レンって誰?」と検索した
「モンストは知っているがスターウォーズは知らない」層の動きがあったのではないかな、と推測する。

ためしに、黄色を差し替えて「ダース・ベイダー」にしてみたら、こちらも4月に大爆発。
悪役二人が、日本においては、むしろ2018年4月に検索を集めていたようだ。やはりモンストの影響が強いのかな。
それも、ダース・ベイダーの黄色いグラフが、カイロ・レンの緑色のグラフを完全に飲み込む勢いだ。
ダース・ベイダーというキャラは、世代を超えて人気が強いね、、、。

ただ、これだと、アクバー提督の紫色のグラフが、ますます、壊滅的である。
さすがに、『最後のジェダイ』に登場していないニッチなキャラを並べたら、
少しは健闘できるかと、やってみる。

ランド、ジャバ、ボバフェットと、
ここまでニッチなキャラを集めて、ようやく、強くなった。。。
さすがにこの5キャラの中では、アクバー提督は健闘して、ハン・ソロと互角である。
最近になってハン・ソロの検索トレンドがハネ上がってきているのは、外伝が公開予定だからでしょう。

ちなみに、地域をアメリカ合衆国に変えて、
最初のキャプチャと同じ五名を入れてみる。
ルークは青、ハン・ソロが赤、カイロ・レンが黄色でレイア姫が緑(日本での調査の時と、色の順番を間違えちゃった、、)、そしてアクバー提督が紫である。
今度は、当然、モンストの影響はないので、
『最後のジェダイ』劇場公開中の、純粋なトレンドランキング勝負となった。
面白いのは、カイロ・レンが普通に強くて、レイア姫が日本に比べて弱くなっちゃったこと。
ただしこれは、レイア姫にはPrincess LeiaとかLeia Organaとか、書き方が複数あるので、
表記ゆれの影響かもしれない。

それでは、スペイン語圏では、キャラのランキングはどうなるか、とか、
インドやエジプトでは好みに違いが出てくるか、とか、いろいろやってみたいことも思いつくが、
ますます、しょうもない遊びになってきたので、今夜はこの辺りにしておこう、、、。

Everybody Lies 書評_3:本書を参考に、GoogleTrendsでバルス祭りを追跡してみる

Everybody Lies“の読後感想、続き。

そうやってアメリカでの人々の「隠れた性向」を検索キーワードから分析していくのが、
標題の”Everybody Lies”の面白さだが、
ここで使われている方法自体は、そんなに難しくない。

似たようなことは、誰でも、無料で、できる。

GoogleTrendsは基本機能だけなら無料で使えるので、
これの対象地域を日本にあわせ、日本語のキーワードを入れてみれば、
僕らも、自力で、「日本人の隠れたキーワードトレンド」を炙り出すことが、ある程度は、できる。

ちょっと、実演してみよう。

GoogleTrendsに入り、たとえば、「バルス」と入れてみると、以下のようなグラフが得られる。

2017年9月27日に、該当のキーワードのトレンドが爆発的に上がっていたことがわかる。サブカル好きの方なら、なぜかはお分かりかと、、。

と、バルス祭りを視覚化するだけなら、あまり面白くもないが、
似たような「ある一日だけの爆発キーワード」があるかどうかを探してみる、なんてのは、面白い。

特にサブカル系や映画系で、
「これは僕以外にはあまり好きな人はいないキャラクターだろうなー」とか思っていたものが、
意外にトレンドで検討していたりすると、これは、うれしくなるし、
ある時期だけ突出していると、そこで世の中に何があったのか、気になったりする。

僕の好きなスターウォーズの世界でいえば、

アクバー提督の検索トレンドが年末に上がっていること、とか。
いやいや、そうですよね。。。誰だって、新作、『最後のジェダイ』を映画館で観ていて、
「あのやけに張り切ってリーダーシップを取っているタコみたいなキャラはいったい誰なんだ?」と
思いましたよね。旧シリーズから見ている人でも、なかなか覚えている人はいないチョイキャラですし
(僕は、初めてスターウォーズを見た幼稚園児の時から、アクバー提督の大ファンなのだが)。

まぁ、日本にはスターウォーズのファン層自体が少ないし、
アクバー提督くらいのキャラになると、みんな、覚えていないのだろう。
アメリカ本土では、きっと、事情が違うだろう。

ありゃ、アメリカで調べてもおんなじだった。。。

※と、やればやるほど、しょうもない分析に堕してきたので、この辺りにしましょうか。

Soccrematics書評_1:欧州サッカーのゴール数をポアソン分布にしてみる

ワールドカップRussia2018が盛り上がっている。
こうなると、洋書好きの僕の、読書対象も、がぜん、サッカーになる。

ただし、サッカーという競技を、プレイヤーに感情移入して観るには、僕には競技経験がなさすぎる(つまり学生時代は文科系、、)。
だが、サッカーという競技を、スポーツ統計として(いやらしい言い方だが、ビジネスとして!?)俯瞰して、
数字を集めて、いじくりまわして、
オーナーやマネージャーに感情移入して、
どの選手・どのチームが「買い」かをああだこうだ言うほうは、それなりの年季が入っている。そういう意味でのサッカーファンである。

↑ただし、これを「純粋なサッカーファン」の前で話題にすると、けっこうシラけられるので、、、これからも、あくまで秘密の趣味にしておこう。

さてと。この場所でなら、数字で観るサッカーの話をいろいろ並べてもいいだろう。

サッカーのデータ分析をめぐる、洋書について話すなら、
最近のものでは、David Sumpterの、”Soccrematics”が面白い!

日本語訳としては、『サッカーマティクス 数学が解明する強豪チーム「勝利の方程式」』という題名で出ている。
これは日本語訳を図書館から取り寄せて読んだが、存外なほど面白かったので、そのあと、英語版を購入した。
一年ほど前に買った本だが、面白い章だけ何度も読み返し、使えそうなデータ分析ネタはノートに抜き書きして、
世の中でサッカーが話題になる時期のたびに、ノートの該当ページを読み返す、そんな付き合い方をしている。

Soccermaticsの著者は動物行動学者なので、もともとは、魚の群れの集団運動をシミュレーションにする、というようなことをしている分野だ、
それゆえ、本書にも、バルセロナやバイエルンミュンヘンの選手の動きを行動モデル化する、など、
高いソフトを持っていないととてもできない高度な分析も出てくるが、
いっぽうで、個人で所有できる分析ソフトでも十分マネできる事例もいっぱい載っている。

特にわかりやすくて、好きなのが、
英国プレミアリーグ(著者はイギリス人!)に観戦に行った場合、
「1試合につき、ゴールシーンは平均、何回見られるか」を統計から割り出したもの。
これは難しいことはない分析だが、確かに、興味はそそられるテーマだ。
純粋にサッカーの楽しみは「ゴールシーンを見ること」だと考えるなら、
《90分ごとのゴールシーン数 = 期待値≫
ということになる。

Soccermatics上での結論だけ先に述べてしまえば、2012-2013のプレミアリーグの試合データで見たとき、
1試合ごとの期待値は2.79。
素直にとらえるなら、サッカーの試合は、だいたい両チームで2点から3点を分け合って決着することになる。

拮抗しているチームなら、1-1で終わるかと思いきや、それが2-1になって決着、というパターンが多く、
実力が開いているチームなら、2-0や3-0で試合が終わり、
4点や5点が入る試合は「今日は点が入りやすい試合だった」という感想をみんなが持つ。
・・・と考えると、実感とも、なんだか、あっている(と、私は思う。いかがでしょう??)

この分析は難しくないので、自分でもPythonを使ってやってみた。
本書では2012-2013のプレミアリーグをベースに分析していたが、
僕のほうは、さらにデータを拡大し、スペイン、フランス、ベルギー、オランダ、ドイツのリーグのデータも加え、
年度も、2012-2017と、最新のデータまで拡大する。

横軸に、1試合のゴール数、縦軸に試合数をとって、matplotlibでヒストグラムにして、
そこにポアソン分布を重ね合わせてみる。(青が実績、緑が平均値と試行数を実績とイコールにして乱数出力したポアソン分布)

 

データを拡張したが、だいたい、Soccermaticsの分析と一致した。
平均は2.7程度。
分布はポアソン分布に近似する。
これが欧州サッカーの特徴、ということになる。

これは、どう解釈しよう。
・サッカーというのは、だいたい、90分間に2~3回のクライマックスがあり、その頻度がちょうどスリリングなので、人気がある
・サッカーというのは、だいだい、90分間に2~3回のクライマックスが生まれるようなルールとシステムのスポーツに調整されていて、人気を保っている
僕個人としては、後者にやや傾いた解釈をとりたい。
たぶん、あんまり派手に点数が入りすぎるようになってくると、
それはそれで面白くないという社会からのプレッシャーがかかって、
けっきょく、だいたい、これくらいに収まる仕組みになるのではないか、と。仮説だけど。