日比嘉高研究室

近況、研究の紹介、考えたこと

NDL Ngram Viewerを使って「私小説」概念の歴史を大づかみしてみた

[目次]


国会図書館のNDL Lab.で、NDL Ngram Viewerというサービスの公開が始まったので、ちょっと使ってみた感想を書く。
が、ちょっとのつもりで書いていたらものすごく長くなってしまった。結論だけ知りたい人は目次から「まとめ 〈点と線の文学史〉から〈量の文学史〉へ」へどうぞ。

lab.ndl.go.jp


どんなサービスなのかということは、NDL Lab.のページに簡潔に書いてあるので、そちらをご覧いただくとよいのだけれど、要するに、国会図書館の蔵書の全文テキスト(ただし今回の対象は「国立国会図書館デジタルコレクションでインターネット公開されている資料のうち、著作権保護期間が満了した図書資料約28万点」)を検索して、検索語の出現頻度を折れ線グラフで表示してくれるサービスである。

1.文芸用語「私小説」の使用頻度を調べる

たとえば、「私小説」という言葉で検索すると、こんな結果が示される。

私小説」出現頻度

言葉が過去にどのように使われてきたのか、ということに関心がある人ならば、このグラフを見ただけで、「ちょっとまって、私に○○で検索させて!」と直感的に思うぐらい、面白いサービスだ。
実際私も、この「私小説」のグラフを見て、おいまじかピークはそこにあるのかよ(❶)と赤い折れ線を凝視したほどである。
 ちなみに、上記グラフに見えるいくつかの増加の山部分について補足的に解説すると、1927年ごろの山は「私小説」概念誕生後に迎えた最初の評論のピークで、中村武羅夫(1924)、久米正雄(1925)、宇野浩二(1925)らが、中村の言った「本格小説」と対比しながら私小説の善し悪しを論じた時期である。
 1935年ごろの山は、小林秀雄の著名な評論「私小説論」の連載(1935)を受けて、『早稲田文学』や『新潮』の特集が続いた時期。
 1940年代の山は、小説作品としての私小説の流行が観察され(無署名1941)、続いて尾崎士郎(1941a,1941b)や矢崎弾(1941,1943)、山本健吉(1943)などの評論単行本の刊行があり、『新文学』(1942)『新潮』(1944)などの雑誌特集が組まれた時期だ。
 予備知識があってグラフを見ると、背景の議論の動態がだいたい推定できる。できるんだが、後述するように、「なんとなく感じてた」ことが具体的な「量」とか「グラフ」とかで示されるということは、十分にすごいことだし、そうした「量」になんて文学研究者はかつてまともに向き合ってきたことなどないのである。

2.複数の検索語彙を重ねて表示させる

さて、このサービスが面白いのは、検索できる言葉がひとつではない、という点にある。たとえば、利用者は「私小説」と同時に別の語――たとえば「心境小説」という言葉を同時に検索し、その折れ線グラフを重ねて表示させることができる。

ああそれならば、とここで思いつくのは、出現頻度から関連概念の歴史的変遷を比較検討してみよう、というアイデアである。たとえば、「私小説」という文芸用語が誕生したのは1920年だといわれているが(中村友1977)、この時期には「心境小説」というよく似ているが、少しニュアンスの違う言葉と同時に用いられていたり、対義語的なニュアンスで「本格小説」という用語が使用されたりしていたことが知られている。評論家中村武羅夫や小説家の久米正雄宇野浩二らは、この時期、こうした「私小説」「心境小説」「本格小説」という語彙を使いながら、作家が自分自身のことを書くこの不思議な小説の形態を批判したり擁護したりと論じ合った。議論の構図をざっくりまとめると、西洋的な長く構築的な「本格小説」に対し、身辺雑記風のせせこましい日本の「私小説」を比べ、後者のありかたを非難したり、逆に擁護したりしていたという感じである。

そしてこの「私小説」と「本格小説」の対比構図は、使用する用語をいろいろと変えながら、戦後にいたるまで延々と続いていく。小林秀雄平野謙伊藤整中村光夫といった著名な批評家達が、その議論の戦列に加わっていったのである。そしてその積み上げられた議論は、戦後昭和の途中まで、純文学、そして日本の近代文学史をを論じる際の強力なパラダイムでありつづけた。

3.「私小説/心境小説/本格小説

さて、NDL Ngram Viewerが複数の概念の出現頻度を重ねて表示させられるならば、「私小説」とそれにまつわる隣接的概念の歴史的布置を、量的な見地から大づかみにできるんじゃないかという気がする。

まず、前述の中村武羅夫久米正雄的な語彙体系の出現頻度を確かめてみる。対象となるのは「私小説/心境小説/本格小説」である。
(*) なお、NDL Ngram Viewerには「年代ごとに何回出現したかを表す出現頻度」と「出現頻度を出版年代ごとの総ngram数で割った値を表す出現比率」との2つを表示させる機能がある。ただ、私が今回使った検索対象語に関しては、後者の「出現比率」は使いにくかった。グラフの下限(1966年付近)に大きな山が出現してしまい、戦前部分のグラフの増減が圧縮されてしまって、見にくいのである。

図2 私小説/心境小説/本格小説 の出現頻度

グラフから読み取れるのは
❶1941年、1943年に「私小説」の語を使用する大きな山がある。
❷「私小説」の語の誕生後10年弱ほどは、あまり使われていた気配がない。
❸「心境小説」の初出は1924年、「本格小説」の初出は1925年あたりらしく、その前の用例が出てこない。
❹1925年当初においては[私小説]より「心境小説」「本格小説」の使用の方が多い。
❺1930年代後半からは「心境小説」「本格小説」の使用頻度は下がる。とくに「本格小説」はあまり使われない言葉となっていく。

というあたりであろうか。❶❷❹のような使用頻度の多い少ないは、人間の目視で資料を読むやり方では、「感触」レベルでしか伝達できないが、コンピュータを用いた計量的分析では、それが可能になる。❸❺のような語の誕生/衰退についても、目視では簡単には言えない。とくに衰退や消滅については、正確に言い当てることは相当難しいだろう。

4.「私小説/純文学/通俗小説」「通俗小説/大衆小説」

検討する用語を変えて、さらに探ってみる。「通俗小説」という語はどうだろうか。「通俗小説」は、「純文学」と対比的に用いられてきた歴史がある。そして「純文学」の一つの代表として「私小説」があった(その考えを批判する議論も同時にあった)。たとえば、横光利一は1935年の評論で次のように言っている。

文学といふものはどんなに「私」を使用しないときといへども、作家が私である以上は私といふ言葉から小説が始まるにちがひないが故である。日本人が私小説でなければ純文学でないと思ふ一つの理由も、このあたりの「私」の複雑さに根づよい原因があるのではないであらうか。横光利一1935)

https://dl.ndl.go.jp/info:ndljp/pid/1232735/121

(*) ちなみに、上記の使用事例も国会図書館の次世代デジタルライブラリで探せる。次世代デジで全文検索して文献を見つけた後、その文献の「書誌」タブから国会デジタルライブラリに跳ぶ。そこで出典ページのURLを得ることができる。すると上掲のように元の文脈が容易にリンクで示せる。

さて、グラフをみてみよう。

図3 私小説/純文学/通俗小説 出現頻度

❻「私小説」と「純文学」の波形は、1930年代を通じておおむね揃っているように見える。
❼「私小説」と「通俗小説」の波形も、1931年から1940年ごろにおいてはおおむね相似しているように見える。
❽「純文学」と「通俗小説」は1914年ごろから1937年ごろまでは、1928年からの5年間を除いて、増減の波形が似通っている。
この観察が正しいとすれば、頻度の増減パターンが似ている時期においては、「私小説」「純文学」「通俗小説」という語を使う際の文脈における共有性があったと推定できるかもしれない。
一方で、目立つのは1940年代前半の動きである。
❽1940年からの4年ほどの間、「私小説」「純文学」「通俗小説」の出現頻度の波形に大きなばらつきがあるように見える。
「通俗小説」や「純文学」が論じられる文脈と離れたところで、「私小説」の語が使われていたことが、含意されているのだろうか。


なお、「通俗小説」と似通った語に「大衆小説」がある。重ねて検索すると以下のようになった。「大衆」の語がよく使われるようなったのは1930年代以降だと認識していたが、グラフはそれを証している。使われる頻度の波形もおおむね似ているように見える。

図4 通俗小説/大衆小説 出現頻度

5.「探偵小説/歴史小説/家庭小説/私小説

波形の類似性を観察するときに気になったのは、単純に出版件数や採録データ数の増減が同じだと、同じ波形になったりしないか、ということだった。念のため、相互に関連のないサブジャンル的文芸用語を重ねてみたのが以下である。

図5 探偵小説/歴史小説/家庭小説/私小説 出現頻度

ばらけている、と見ていいように思う。関連のない語・薄い語は、やはり波形がずれると考えていいのではないか。これに加えて、
❾使用頻度の規模感が相対的に掴める
ということもここで気づいた。モダニズムの時代に探偵小説への言及は、この規模で増えていたのか、とかそういうことである。

図5の折れ線グラフは、どの時代にどのサブジャンル語がどの程度の規模で使われていたのか、を示しているが、私にはこれはそのまま明治から昭和戦前期の、近代小説史の略図を見ているかのように感じられた。

6.冷静になってちょっとデータを補正する

最初にNDL Ngram Viewer を使って「私小説」を検索したとき、大きなピークが1941, 1943年に現れた。他の時期を圧する大きさなので、少なからず驚き、これはこれまでの認識を改めなければならぬ…と思った。が、いろいろデータを見ているうちに、少しこの結果を検証してみようと思うようになった。
Ngram Viewerは出現頻度を単純に積算しているようだ。たとえばAという文献に「私小説」の語が5回現れた場合、カウントは5となる。つまり、一冊の本で、100回「私小説」と連呼した文学者がいた場合、その年はその一人の一冊のために、+100を獲得してしまう。これはちょっと差っ引いて考えたい。
そこで、Ngram Viewerから跳んで(グラフ上の●をクリックするとその年の次世代デジタルライブラリに跳ぶ)、何件の文献がヒットしているのかを、逐一確かめてみた。結果は以下である。「私小説」という語の、次世代デジタルライブラリのヒット件数(文献点数)と、Ngram Viewerの示した頻度(語の出現頻度)、そしてその比率が示してある。

西暦 次世代デジ 国Nグラ Nグラ/次世代デジ
1920 0 1 #DIV/0!
1921 1 1 1.0
1922 2 2 1.0
1923 2 2 1.0
1924 1 5 5.0
1925 5 11 2.2
1926 7 14 2.0
1927 7 50 7.1
1928 2 2 1.0
1929 4 17 4.3
1930 8 21 2.6
1931 8 27 3.4
1932 5 22 4.4
1933 0 1 #DIV/0!
1934 8 22 2.8
1935 18 81 4.5
1936 16 42 2.6
1937 11 43 3.9
1938 9 17 1.9
1939 17 53 3.1
1940 22 75 3.4
1941 20 226 11.3
1942 15 108 7.2
1943 19 360 18.9
1944 3 67 22.3


この結果わかったのは、実は文献数的には1930年代のピークと、1941,43年のピークとは、ほとんど大差がないということであった。別の言い方をすると、1941, 43年のピークは、矢崎弾や尾崎士郎などといった批評家や小説家が、著述の中で「私小説」を主題化し、繰り返しこの後を用いたという事態によって形成されていたようである。これは最初の直感からはズレることになるが、それはそれで大事な知見である。また❽に挙げた、1940年代前半の特異性を考える際の参考にもなりそうである。

最後にしつこいようだが、次世代デジタルライブラリの件数(全文中に「私小説」の語を含む文献点数)と、Ngram Viewer(「私小説」の語の出現頻度)と、国会デジタルライブラリ(タイトルおよび目次に「私小説」の語を含む文献点数)と、朝日新聞(目次およびキーワード?に「私小説」の語を含む記事数)を、一つのグラフにまとめておいた。これはエクセルを用いた。
(*) ただしNgram Viewerだけ突出して数字が大ききので、グラフが読みにくい、4で割って見た目を補正している。

図6「私小説」DBごとの件数

7.まとめ〈点と線の文学史〉から〈量の文学史〉へ

今回、文芸用語としての「私小説」の使用のされ方を、Ngram Viewerを使って探ってみた。使ってみて従来の人力による分析ともっとも異なると感じたのは、
・量の規模
・増減の波形
・持続期間
についての知見が得られる
ということである。これらは、いずれも人の目と手だけを使っていたのでは、説明・証明が非常に難しい。大量の資料を読まなければならない上に、結局規模や増減のようすを個人の「感触」としてしか伝達できなかったり、語の出現と消滅の証明が非常に困難だったりするからである。
これに対して、コンピュータを用いた計量分析は、「量の規模」「増減の波形」「持続期間」などをはっきりした数やグラフで表現してくれる。

これまでの文学史は、点と線によって書かれてきたといってもいい。中村武羅夫本格小説を礼讃し、久米正雄私小説を称揚し、小林秀雄が「私小説論」を連載して注目を集め、伊藤整平野謙私小説と心境小説とを対比しながら私小説作家の2類型(逃亡奴隷/仮面紳士とか、破滅型/調和型とかいうやつ)を作ったとか、中村光夫の「風俗小説論」が影響力をもった、というような著名な〈点〉を取り上げ、それらをつなぐことによって〈線〉としての文学史が描かれる。

これに対し、膨大な本文データを読み込み分析するコンピュータは、我々の問いかけ=検索語に対して、〈量〉としての回答を出力してみせる。私たちはこのとき、誰が何を書いたの連鎖ではなく、いつどれだけの言葉が生まれ、増え、消えていったのかという量の持続や消長として、文学史が書かれうるのではないかという夢想に導かれる。

〈点と線の文学史〉から〈量の文学史〉へ。国会図書館の蔵書の全文検索という資料面でのかつてない大変動に、自然言語についての分析技術の進化がかけ合わさっていく時代が到来している。文学史もまた、その姿を変えていくはずではないか?



言及した文献(年代順)

中村武羅夫(1924)「文芸時評 本格小説私小説と」『新小説』29-1
久米正雄(1925)「創作指導講座 「私小説」と「心境小説」(一)(二)」『文芸講座』文藝春秋
宇野浩二(1925)「「私小説私見」『新潮』43-4
小林秀雄(1935)「私小説論」『経済往来』10-5~10-8
横光利一(1935)「雑感」『覚書』沙羅書店
私小説特集(1935)『早稲田文学』2-9〔徳永直、矢崎弾、谷崎精二ら〕
私小説特集(1935)『新潮』32-10〔尾崎士郎中村武羅夫河上徹太郎ら〕
無署名(1941)「〈新潮評論〉「私小説」の流行」『新潮』38-7
尾崎士郎(1941a)『文学論』平凡社
尾崎士郎(1941b)『人生読本』学芸社
矢崎弾(1941)『文芸の日本的形成』山雅房
伊藤整上林暁丹羽文雄(1942)「『私小説』論」『新潮』39-5
私小説特集(1942)『新文学』1-5〔福田恆存高橋義孝、高木卓ら〕
私小説特集(1944)『新潮』41-3〔森山啓、渋川暁ら〕
矢崎弾(1943)『近代自我の日本的形成』鎌倉書房
山本健吉(1943)『私小説作家論』実業之日本社
中村友(1977)「大正期私小説にまつわる覚書(一)『学苑』445