日比嘉高研究室

近況、研究の紹介、考えたこと

デジタル化と大学図書館の未来──横田氏講演の感想メモ

3月22日、横田カーター啓子さんが、名古屋大で講演をして下さった。図書館の方、大学院生、研究者、出版関係者、その他の方が集まって、密度の濃い2時間あまりの集会となった。私は役得で、その後の食事会でも議論と情報交換を続行した。

いろいろ考えさせられることが多く、そのままにするのももったいないので、自分の頭の整理をかねて少し考えたことなどを整理しておく。

以下は横田さんの講演と、その後の意見交換を踏まえ、日比の私見を書いたものとなっている。横田さんのお話の全貌を示すものではないので、その点は誤解なきようお願いします。

目次はこんな感じ:

  • 「図書」館から情報基盤センターへ
  • 研究データの収蔵先としての図書館
  • デジタル資料の持続可能性
  • 格差──大学間格差
  • 格差──代理戦争気味な
  • 研究成果のSEO
  • デジタル化はリテラシーを上げるかもしれない
  • 選書の終焉?
  • おわりに 研究者はbotにひれ伏すか

「図書」館から情報基盤センターへ

アメリカの大学図書館では、分野によっては(STEM系[科学・技術・工学・数学]それから医学、経済も)、紙の本がどんどん撤去されているという。ミシガン大では、医学系と経済学系の図書館は本棚がなくなって、利用者のワーキングスペースになっているそうだ。

そして所蔵するアイテムが、どんどんと本や雑誌だけではなくなっている。

「図書」館は、総合的な情報基盤センターになっている。

研究データの収蔵先としての図書館

米国では、分野によっては(政治学が例に挙がっていた)、査読雑誌に投稿するときには、根拠となるデータも公開することが義務づけられるようになっているという。アンケートや統計データなどを公開する感じだろうか。この傾向は、研究資金を出している組織や団体が、助成を受けた研究者に対し、研究成果の公開する際には、結果だけでなく調査によって得られたデータも公開することを条件にしているということが後押ししている。

そしてそのデータの保存と公開を引き受けているのが、大学図書館だという。

この話を聞いていて思いだしたのが、今年の1月24日に『朝日新聞』で読んだ以下の記事である。

国から研究費、論文を原則公開 ネット上で、根拠のデータも対象
2016年1月24日

公的資金を使った研究について、政府は学術論文やデータをネット上で原則公開させる方針を決めた。国内の科学技術関連予算は年間約4兆円に上るが、論文の多くは有料の商業誌に掲載され、自由に閲覧できない。成果を社会で広く共有し、研究の発展を促す狙い。

〔…〕

 国の研究費を配分する科学技術振興機構日本学術振興会が大学などに研究資金を出す際、論文の公開を条件にする方法などを検討している。研究者は、論文を無料で読める電子雑誌に投稿するか、有料の雑誌に出す場合は大学などが設ける専用サイトで、ほぼ同様の内容を無料で読めるようにする。

 STAP細胞などの研究不正が相次いだことなども受け、論文の根拠となったデータも公開の対象とする。知的財産などに問題のない範囲が対象で、データを管理、検索できる基盤作りを国立情報学研究所が中心になって進める。

http://www.asahi.com/articles/DA3S12175059.html

私はこの記事を読んだときには、「人文系にとって『データ』ってなんだよ。どーすんだよ」的な混ぜっ返しをFacebookの投稿で書いていたのだが、今回、政府のいっている発想の出元が、遅まきながらわかった。

研究資金は、普通、3年とか5年とかいうように期限が限られて与えられる。研究者はそのなかで成果を出すわけだが、「データまで公開せよ」と言われたときに困るのは、研究資金が終わったら、どうやって公開し続けるのよ、ということである。だれが、どこに、どうやって、どんな形式で置くのか。メンテナンスはどうするのか。

大学図書館がそれをやってくれるのならば、ありがたい。というか、実質、それしかないだろう。

デジタル資料の持続可能性

Sustainability(持続可能性)といえば、環境問題のことかと思っていた私は、この言葉がデジタルと図書館の文脈で出てきて、びっくりすると同時に、とても腑に落ちた。

私の家には明治期の雑誌某々のCD-ROMが一山あるが、それは私が2000年前後にWindows2000のマシンで使っていたものだ。もちろん、もう使えない。いや、正確にいえば、それを使いたいがために、Windows2000のマシンを納戸に押し込んである。いざとなったら使うぜ、というつもりで。むろん、押し込んで以降、一度もスイッチを入れたことはない。

ありふれた光景である。が、恐ろしい事態である。

個人持ちの雑誌程度なら、「もったいない!」で終わるが、これが大規模なデータベースなどになると、それが消えることは社会的な損失である。一つ例を出せば、講演後のディスカッションでも話題になった「20世紀メディア情報データベース」http://20thdb.jp/outline がある。米軍占領下の日本関係資料を集めた大規模な文庫(プランゲ文庫)の詳細な検索データベースだ。科研費を獲って整備・公開されたデータベースだが、その後代表者の退職や資金の切れ目などがあって、NPO法人のインテリジェンス研究所がデータベースを管理する体制となったと聞いている。国会図書館とも連携を取っているようなので、今後さらに展開・移管があるのかもしれない。このデータベースの問題など、研究成果として得られたデータベースの「持続可能性」が必要かつ重要な好例だろう。消えてなくなっては、困る。

ただし、実際に研究者たちが作成したデータベースを持ち込まれる大学図書館などのことを考えれば、担当者が頭を抱える姿が目に浮かぶ。いったん置き場所が決まったにしても、それを公開し、要望や不具合やクレームに対応し、日々変わっていくIT環境にあわせてアップデートし続けていかなければならない。電子資料を持続可能なものにするとはそういうことだ。

専門家を雇い、金と時間を投下しないと、絶対に実現不可能だということだけは間違いない。

格差──大学間格差

デジタル化は、距離を飛び越え、ギャップを埋め、さまざまな格差を解消する方向へ向かう、という夢は、たぶんもう多くの人は信じていない。むしろデジタル化は、別の格差を生み出している。デジタル・デバイドという言葉も生まれた。最近では、スマホは使えるがパソコンは苦手だという学生が話題になる。

資料のデジタル化の進展は、大学間格差を広げている。典型的なのは、電子ジャーナルや、電子書籍である。これらはいま、パッケージ販売されるのが普通になっている。予算が潤沢な大学図書館は、これらを「大人買い」する。「全部買うから40%まけろ」という交渉をしたりするそうだ。

パッケージ販売された雑誌や図書には、権利が付随してくる。その大学のIDを持っていれば、自由にログインして閲覧やダウンロードができる。そうでない人は、アクセスできない。

紙媒体の時代は違った。資料と閲覧資格は対応していなかった。デジタル化された資料は、利用者を選ぶ。いやな言い方をすれば、研究大学にいる研究者と学生は、豊富な研究資料に出会えるが、そうでない大学に所属する研究者と学生は、そもそも必要な論文や資料にアクセスできないという時代に、我々はもう入り込んでいる。

ミシガン大学では、そういうアクセスに困難を抱えた研究者向けに、夏季などに特別に図書館の利用機会を設けたりしているそうだ。具体的なことは聞き損じたが、一時的な利用者IDなどを付与するのだろう。デジタルデータを見るために、遠距離の大学まで足を運ぶという転倒。もちろん、移動も、利用も、有料だろう。日本もすでにそうなりつつあるが、放置すれば格差はこの先開く一方だろう。

格差──代理戦争気味な

横田さんは、日本研究関連の資料の電子化スピードが遅いことについて、かなり危機感を持っている。それは米国の図書館の、東アジア部門のなかに身を置いて、中国研究や韓国研究のライブラリアンたちと、人、金、場所の奪い合いをしながら仕事をしている彼女にとって切実な問題だと感じられた。

私も、同様なことは別の方向からも聞いている。東アジア圏以外における、日本語教育の世界では、中国語、韓国語とシェアの奪い合いをしなければならない。(このことは、以前に別の記事を書いたことがある。「語学教育と覇権主義http://hibi.hatenadiary.jp/entry/20140929/1411970219

私自身は、こうした「奪い合い」の発想には反対である。奪い合いではなく、かけ算の考え方でいかないといけない。東アジアの文化は共通する点も多いし、交渉も密だ。排他的に考えるのではなく、互いの知識の共有化を図り、差異を発見につなげていった方が研究も進むし、付き合いも上手くいく。

ただし一方で、日本関係の教育研究資料のデジタル化が遅れることによって、日本研究関係の教員・学生が不利益を被るのは確かである。いや、かけ算の発想で言うならば、それは日本に関心を持つ他地域・他領域の専門家にとっても、(もしかしたらより一層)不利益なのだ。

デジタル化は人を怠け者にする。デジタル化がこのまま進行した場合(むろんそうなる)、紙でしか手に入らないということは、多くの人はそれを見ない=無いも同然、という世界がやってくる。研究の世界ではともかく、教育の世界でこれは致命的だ。日本に関心を持つ人を再生産していくプロセスが、どんどんと先細りになっていく。

東アジア諸国内の意地の張り合いのような文脈でそれを語るのは問題が多いが、殿様然としてデジタル化の遅れという事態を放置すれば、日本研究はますます沈没し、日本に関心を持つ人の数も減っていくだろう。

研究成果のSEO

SEO、すなわち Search Engine Optimization、検索エンジン最適化のことである。GoogleやYahoo検索の上位に、どうやって自分のウェブサイトが表示されるにようにするか。そのことは自己の会社の収入に直結するので、担当者は血眼になって対策を行う。

研究の世界で、より広く論文が読まれ、評価を高めるためには、評価の高い雑誌に論文を掲載してもらうのが王道である。私のような人文系だと、評価の高い学術出版社から単著を出す、というのもかなり効く。

だが、御承知のようにそれ以外の回路でのアクセスの数は、侮れなくなっている。とりわけ、コアな同業者向けではなく、より広い論文読者層を視野に入れた場合(他分野の研究者や、学部学生、一般市民など)、Googleなどのweb検索で研究成果が上位に来ることは、とても重要になる。(学会からの評価についてはここでは問わない)

そしてここでさらに問題になるのが、「フルテキストがその場で手に入るかどうか」ということである。

一度、期末レポートで面白い経験をした。絶対に参考文献を読んで書けと念押ししたところ、ほとんどのレポートが共通する論文に言及してきた。そういう論文が、三本ぐらいあったと記憶する。専門家の観点からすると、「なぜこの論文?」「これなら他にこっちが…」という選択だった。

もしや、と思ってググってみたら、案の定それらの論文は、googleの検索結果の上位に位置しており、そしてそのままフルテキストが手に入る論文だった。

学部生だし、仕方ないでしょ、専門家は違う、と思った人には、そうではないと言いたい。

読まなければならない参考文献は、「絶対に読む」から「どっちでもいい」までグラデーションのように広がっているのが普通である。たとえば、私はオリンピック、とりわけ1932年のロス五輪の表象について最近関心を持っている。「オリンピックと文学」みたいな論文は、絶対に読む。「オリンピックの歴史」は、ものによる。1932年のことが多ければ読む。出場選手の回想記も、人による。1932年のロサンゼルスの都市開発についての論文は、まあ時間があったら読んでもいい。

この「読むか読まないか」を判断する際に、その論文がフルテキストで手に入るかどうかは、ものすごく影響を与える。検索してフルテキストがその場でそのまま手に入るならば、たいていの人はそれをクリックして表示するからだ。この一歩はものすごく、大きい。

学会誌の電子化の議論の場に、何度か居合わせたことがあるが、反対派の人の多くは、閲覧対象を同業者の範囲でしか考えていない(いや、そもそも電子化がわかっていない人が反対に回る場合が多いわけですが、それはさておき)。そうではなく、電子化の価値は、同業者以外とか、海外の同業者とかそういう人たちのことを考えて行うべきである。研究成果は、読まれてナンボだ。

デジタル化はリテラシーを上げるかもしれない

日本の古典籍の電子化が進んだことによって、海外でもそれを容易に読めるようになってきた。その結果何が起こったか。「くずし字」で資料を読まなければならないと考える古典研究者たちが海外に現れた、と横田さんは言った。これまでは活字化された資料をもとに主に研究してきたが、活字化されていない資料(活字は近代の産物であるから、古典籍のデフォルトは当然非活字である)にも取り組もうといつことである。これは明らかに研究のレベルアップである。

電子化は、いろんなことを容易にするという方向で想像されることが多いが、電子化されたことによって新しく高いハードルを越えていこうという人が現れる。

私はこの話にとても驚いたし、すばらしいな、と思った。


選書の終焉?

デジタル資料のパッケージ販売のことについては、上で少し触れた。この話題で横田さんと私が一致して危惧したのは、選書はどうなるの、という問題だった。与えられた予算のなかで何を買うか、というのは図書館員の腕の見せどころであるはずだ。

ところが、パッケージ販売された場合、中身を決めるのは販売側になる。もっといえば、中身が決まるのはその本をデジタル化するかどうか、そして商品化するかどうかの局面において、となる。欲しい本を買うために、いらない本が付いてくる抱き合わせ販売や、おおざっぱな「分野買い」みたいなものが横行して、選書機能が死んでいくということが起こる可能性がある。(まさか○タヤ図書館みたいなことは起こらないと信じたいが)

そしてそれは一つの大学図書館だけで起こるのではなく、多くの大学図書館で同時に起こる。同じパッケージをみんなが買うからである。

この未来を後押しするのは、図書館はどこでも本の置き場に困っているという現実である。今後どんどん所蔵スペースの観点で電子書籍の需要は高まっていき、紙の本は買ってもらえなくなっていく。

選書機能の死は、蔵書の画一化を結果する。


おわりに 研究者はbotにひれ伏すか

デジタル資料化以降の図書館の役割は、資料の所蔵ではなく、資料の利用資格の購入・管理・制御と、場所の提供になる。「図書」館から情報基盤センターへという移行が、ここでもはっきりしてくる。

「図書館」時代の検索は、所蔵検索だった。その資料がそこにあるのか、ないのか。あるならどこにあるのか。デジタル資料時代の検索は、データ・マイニングに限りなく接近していくだろう。検索の対象は本のタイトルやキーワードではなく、全文検索となる。その資料がそこにあるのか、ないのか、はすでに問題ではない。資料はその端末が接続されたネット上のどこかにあればよく、そこにアクセスする権利がありさえすればいいからである。

おもに図書館と本屋で仕事をしてきた領域の研究者は、電子化が進展して以降、職能を変化させざるをえなくなるだろう。資料の収集と分析は、そうした研究者の大切な専門性だったが、遠からずbot(自動化プログラム)を数時間走らせることにより、資料の収集の大半を完了することができる時代が来る。研究者は、集まった資料を分析のためのプログラムに突っ込む。結果は、ほぼ瞬時に表示される。このとき、研究者の役割とは、いったい何になるのか? 

botが集めきれなかった史資料の探索? もちろんそれは大事だ。デジタル化されていない資料は、常に残っているだろう。だがそれも技術の進歩がデジタルの海に早晩飲み込んでいく。落ち穂拾いは、場つなぎでしかない。

botのパラメータの調整? 自動収集されたデータを、分析プログラムにかけるためのデータの編集? もちろんそれは必要だ。そしてそれは知識と時間が必要になろう。ではそれが研究者の仕事になるのだろうか。それは私には、機械と機械の橋渡し役にしか見えないのだが…

あるいは研究者は、プログラムを開発できる研究者と、誰かが開発したプログラムを利用する研究者に二分されるようになるのだろうか。

もちろん、人文系の知はそんなにやわではない。それは人間や社会にとっての「問題」そのもののありかを指摘し、掘り出し、知らしめる知だからである。相手は人間であり、現代であり、そこにつながる過去と未来である。「問題」を触知し構成する感度と思考は、プログラムによっては代替できない。

ただし、研究者は今後、「その研究はコンピュータでもできるのではないか」という疑問に、つねにさらされていくだろう。創造性と感度を欠いた研究は、機械によって淘汰されていくのかもしれない。




以上、長くなりました。