作家の文体をコンピューターで分析する学問が存在する。これを応用言語学と呼び、ときに計量文献学にも含まれる。今回は言語学を勉強している身から、この学問の先端ともいえる本「ベストセラーコード」を、日本の文化に当てはめてレビューしてみようと思う。
作家は、運か、才能か――。こう疑問に思ったことはないだろうか。
出版社のマーケティングによって売れるものは作られており、売れるかは広告費にかかっている気もする。 本書は、“ベストセラーにはベストセラーコードが埋もれている”という仮説に基づき、NYタイムズ紙のベストセラーリストを中心に膨大な小説データをコンピューターに読み込ませ、「テキストマイニングは出版を変えるか」検証した本である。
- 著者
- ["ジョディ・アーチャー", "マシュー・ジョッカーズ"]
- 出版日
- 2017-03-23
“訓練された読み手であれば、その作家がよく使う形容詞に気づくかもしれないが、名詞との組み合わせの率、つまり作家が形容詞を使ってどれくらいの頻度で名詞を修飾しているか、といったことまでにはなかなか気がまわらないだろう。コンピューターなら簡単にできる。”
機械学習や自然言語処理の方法を論じたものではなく、あくまで小説が好きな人の好奇心に基づいて研究されたテーマを一般大衆向けに紹介している、といった感じである。
“それは描写や文体を考えるときに重要な情報となる。さらにコンピューターは、ある本で発見した比率をほかの数千冊の本に見られる比率と比較分析できる。もし、ある比率がベストセラーにおいて高かったり、低かったりすれば、それは重要な意味を持っていることになる。”
そして、『ハリーポッター』、『ダヴィンチコード』など、超ベストセラーには、いくつかのある法則性があることを見出してゆく――。
あくまでアメリカの著作物の法則性の話で日本に当てはまるか微妙ではあるが、ちょこっと村上春樹も登場したりする。
ここから、第5章「ノワール――「ガール」は何を求めているのか」に焦点を当ててゆく。
2008年以降、アメリカで「ガール」を主役にした大ヒット作が目につくようになった。たとえば、『The Girl with the Dragon Tatto <ミレニアム1 ドラゴン・タトゥーの女>』、『Gonne Girl <ゴーン・ガール>』である。
これは、社会的な女性の社会的立場の変化を示しているのだろうか?
“ベストセラーリストに登場するガールは、普通の女の子ではない。大衆文化における新しいヒロインなのだ。やさしくて愛らしい少女ではありえない。居場所がなく、社会に適応できず、怒っている。それがガールズ・ノワールの主人公だ。”
ベストセラーに登場する主人公に人間的魅力がある、というのは本書で提示されているベストセラーの条件の一つである。多くの人々が注目するキャラクターとは、主体性を持ち、強い推進力を秘めた特別な人間なのだ。
しかし、この「ガール」の描写で私たち日本人は何かを連想しないだろうか。たとえば、AKB系のグループの、秋元康が書く歌詞に出てくる少女とか?依存しない自立した女性ということなら、最近欧米でも人気のあるモーニング娘。の方が当てはまっているかも?
「セーラームーン」など戦闘少女ヒロインものをはじめ、日本ではこうした「伝統的でない女性」が主人公のアニメ、漫画がヒットしてきたが、それが今、海外に輸出されてウケているのだ。じつはこうした「ガール現象」は現在の世界的な潮流である。そして、なぜかこうしたガール主人公たちの内面は複雑で、何か問題を抱えている――。
こうした「ガール」を中心に物語が展開する小説は、キャラクター小説といえるだろう。キャラクター小説といえば、日本のライトノベルがまさにそれである。
“そこにはある種の浄化がある。ヒロインは女性に課せられた重荷を跳ね返そうと闘う。〔…〕ヒーローあるいはヒロインというのは、困難を乗りこえながら、フィクションの世界に浄化をもたらす行為主体者なのだ。彼らがそれを成し遂げるのを見るのは読書の楽しみのひとつといえるだろう。”
本書では、こうした「ガール」現象は今の時代、私たちの文化が何かを渇望し、ある種の冒険あるいは逃避を求めていることの表れではないか、と述べられている。ガールについて、興味深い論文でも書けそうなテーマではある。しかし、今回は社会学の視点ではないので、これ以上論は進めないで保留にしておくこととする。
ベストセラーに登場する主人公たちの特徴である「主体性」を、コンピューターは単語によって判断した。
キャラクターをコンピューターが分析するのは難しい。そこで、ベストセラーコードは、小説のなかで使われているキャラクターの名前と代名詞をコンピューターに探させ、それから一緒に使われる動詞を調べる手法を取ったのである。その結果、キャラクターの動詞主体性をかなりの程度まで分析することが可能となった。
必要として(need)、ほしがって(want)、掴んで(grab)、実行し(do)、考えて(think)、訊いて(ask)、見て(look)、離さない(hold)。そして、愛する(love)。
上記のような主体的な動詞の頻出度と、ベストセラー作中での主人公の主体性は関連するのである。ゆえに、ヒットしない小説のキャラクターは受動的な動詞で表される傾向が強いというデータも出ている。ネガティブで受け身な主人公は万人ウケしないが、こういった人間の魅力は、コンピューターもわかるようになってきているのだ・・・。
- 著者
- ["ジョディ・アーチャー", "マシュー・ジョッカーズ"]
- 出版日
- 2017-03-23
このように『ベストセラーコード』にアルゴリズムで説得力を持って分析されてしまえば、これから本を出すとしたら、意図的にベストセラーを作り上げることも容易な時代が来ているのだろうか?という結論に誘導されてしまうかもしれない。
しかし、ベストセラーコードが導き出す「完璧な小説」と最も近かったのは『ザ・サークル』という、テクノロジーの進化に警鐘を鳴らす作品であった、というなんとも皮肉めいたエピソードも存在する。
また、日本で話題書となった『統計学が最強の学問である』の西内哲氏が巻末の解説で、これを日本ver.で適用するのは注意が必要だよ。日本で似たような研究をしたい時には僕に相談してくれれば力を貸すよ、と待ったをかけているのも、解説がデータ分析のプロとしてクリティカルな視点を含んでいておもしろい。
言語学を学んでいる実感として、最近データを用いた言語学が優位になってきています。しかし、ガールズ・ノワールもさることながら、文化や自分の感覚も重視するべきなんだと思いました。