イベント記録

日本生化学会大会シンポジウム「オープンサイエンス時代を生き抜く研究者とは?」(詳細記録あり)

AIは今後の研究活動において必須のツールですが、一方でAIによるFake Scienceの拡大により研究の信頼性が損なわれることが懸念されています。近年、「責任ある研究・イノベーション」という文脈で、研究者の社会に対する責務が注目されています。この流れの一環として、「オープンサイエンス」という研究活動の実践が推奨されています。透明性の高いプロセスを経て、信頼できる研究を送り出すという研究活動の原点に回帰することは、AIとの適切な関係性を築く上でも重要です。本シンポジウムではオープンサイエンスの現状、今後の展望を取り上げ、フロアの皆様とともにこれからの研究者のあり方を探ります。

2025年11月4日(京都国際会議場)
オーガナイザー:田中智之(京都薬科大学)、木村洋子(静岡大学、研究倫理委員会委員長)

講演

オープンサイエンスの潮流を踏まえた科学と社会の変容にみる、研究、研究者コミュニティ、研究機関の再構成
林和弘(文部科学省 科学技術・学術政策研究所)

要旨:
オープンサイエンスの潮流は、研究成果の公開や共有にとどまらず、研究プロセスの透明性向上、研究資源の相互活用、市民の科学参加、さらには国際的な協働の促進といった多面的な変化をもたらしている。その結果、研究の進め方や評価基準、知の生産および流通の構造が大きく変容し、科学と社会の関係そのものが再編されつつある。本講演では、こうした変化を多層的に捉え、「研究者個人」「研究コミュニティ」「研究機関」という三つのレベルにおける再構成(Reconfiguration)の可能性について論じる。具体的には、AIとデータ駆動型科学の進展、プレプリントやオープンピアレビューの広がり、研究評価のパラダイムシフト、機関リポジトリや研究データ基盤の整備状況、さらには研究機関の社会的責任やガバナンスの在り方の変化などを取り上げる。オープンサイエンスに端を発する科学の構造転換は、単なる技術的対応ではなく、「知の公共性」や「科学の社会的正当性」といった根源的な問いに直結する課題である。日本および国際的な動向を俯瞰しながら、科学と社会の関係がより協働的かつ循環的なものへと移行する中で、研究の基盤や仕組みをいかに再構築していくべきかを検討する。あわせて、このようなパラダイムシフトが一朝一夕に実現するものではなく、世代交代や法制度の刷新といった社会制度全体の変革を伴う長期的課題であることを踏まえ、過渡期にある現代においては、理想と現実の間で少なくとも二つの方向からの展開が必要であるという視点についても解説する。

Trust in Research in the Age of Generative AI
Leslie McIntosh, Helene Draux (Digital Science)

Abstract:
Through the lens of research integrity and forensic scientometrics, we will explore risks exacerbated by generative AI, highlight detection strategies, and apply practical solutions to preserve trust in scholarly communication.
Background Trust in science underpins innovation, informs policy, and enables societal progress. The integration of generative AI (GenAI) has the potential to streamline and enhance the research process; however, it also poses a threat to the foundational principles of authenticity, reproducibility, and transparency. AI-generated manuscripts, images, and data can be rapidly produced at scale, with increasing sophistication, often indistinguishable from human-authored outputs. Instances of AI-generated fraudulent content bypassing current review processes have exposed significant vulnerabilities in the research validation systems. These challenges are not entirely new, but the scale and speed of GenAI outputs exacerbate them. There is a pressing need to reimagine how research integrity is evaluated, signaled, and governed.
Methods This session presents techniques from forensic scientometrics (FoSci), which combines traditional scientometrics methodology with the examination of research papers, individuals, and networks. We will anchor our discussion using the “trust markers” taxonomy, developed to address current gaps in the signaling of research integrity and empirically tested across a dataset of 33 million full-text scholarly publications. We will present a real-world case study, where anomalies will be identified using forensic techniques, including authorship pattern analysis and citation forensics.
Conclusion FoSci emerges as a crucial interdisciplinary response to the evolving challenges of research misconduct in a technologically complex landscape shaped by GenAI. By merging forensic analysis with scientometric methodologies, FoSci offers scalable, evidence-based strategies to detect and prevent unethical behavior in research.

大規模データ時代の実験生データ保存戦略 ―東大・定量研での実践と教訓―
須谷 尚史(東京大学 定量生命科学研究所)

要旨:

再現性と透明性が重視される現在の生命科学では、論文の根拠となる “生データ” を長期的・体系的に保存し、検証と再利用に備えることが欠かせません。一方で、ハイスループット計測によるデータ量の増加や、研究者の流動化の進行は、従来の管理体制にとって大きな課題となっています。
東京大学 定量生命科学研究所では、研究倫理推進室が中心となり、論文受理後に全ての生データと関連ファイルを収集・保管する取り組みを8年以上にわたり継続しています。そのための運用基盤として、Google Workspace を活用した「MODシステム」を独自に構築し、現在に至るまで実践を重ねてきました。
本講演では、私たちのデータ収集・保管の取り組みの詳細や、8年にわたる運用から得られた教訓についてご紹介いたします。具体的には、「収集フローと運用体制」「保存媒体とメタデータ管理」「研究室への負担軽減策」などについてお話しする予定です。
オープンサイエンスの潮流の中で、データ保存は単なる義務ではなく、データを公開資源へと発展させ、研究の信頼性や価値を高める可能性をもつものと考えられます。定量研における実践から得られたノウハウやつまずきポイントを共有することで、今後の制度設計や現場での運用の一助となれば幸いです。

パネルディスカッション

木村洋子、須谷尚史、田中智之、林和弘

田中 ここからはパネルディスカッションの形で進めていきます。貴重なお話をありがとうございました。まずは、オンラインでいただいた質問から進めます。オープンアクセスの義務化が2025年度の研究助成から開始していますが、論文だけではなく、研究データは実際にどのように取り扱えばいいですか。私が最近聞いた話では、本日も須谷さんが話されたように、論文とダイレクトにひも付いている部分からという話はありますが、正式には決まっていないと認識しております。林さんいかがでしょうか。
 はい。作った側です。よく誤解されるので、おさらいをします。2025年、今年の助成金から即時オープンアクセスが義務化です。今年に論文を書く方については、12月になると話は別かもしれませんが、対象外です。もちろん推奨ですが、本年度から配分された研究費が対象です。実はさらに四つぐらいに絞られます。科研費の一部とJSTの一部とAMEDの一部です。詳しくは政府のサイトを見ると、書いてあります。研究助成を受けるときにその説明が入るので、基本的にはそのガイドラインに従ってください。
 その上で、論文については即時オープンアクセスの義務化です。よく読むと、実はしっかりと根拠データもオープンと書いてあります。田中さんのご指摘のとおりです。ただし、根拠データの定義は、それぞれの研究者コミュニティーで決めてくださいと、一見は丸投げで書いています。少し議論を呼ぶかもしれませんが、私がとても不思議に思うことがあります。日本の先生がたの中には行政側で決めてくださいと言う方がいますが、欧米だと絶対にそのようなことはありません。行政側が根拠データの定義を決めることができるわけがないので、それぞれのコミュニティーの中でモラリティを持って示してくださいと書いてあります。それがなぜか内閣府、文部科学省は曖昧という批判を受けることがあり、日本のサイエンスカルチャーの特殊性を感じます。コミュニティーでどのようにすればいいのかは、まさに本日の須谷先生の話のように、定量研究の近傍であれば、このように画一されたものを、根拠データとして出せばいいです。例えば私が専攻していた有機合成化学の場合です。新規化合物であれば、1990年代からスペクトラムデータを全て紙で出していました。論文はこれだけなのに、これぐらいのものを紙でアメリカに郵送していました。1992年ぐらいに送っていましたが、それをデジタルで行う感じで、コミュニティーごとになぜその論文が妥当であるのかを示すデータを付けることになると思います。
田中 本来は学会のように、学術の領域ごとに議論される必要がありますね。
 そうです。
田中 須谷さんからお話をうかがいたいです。どこまで保存するというか、どこまで管理すればいいのかは難しいと思います。例えば生化学の分野だとこの辺りかもしれないということは、所内で何か議論はありますか。
須谷 明確な答えをだすのが難しい問題です。多くの実験で装置を使ってデータを取ると思いますが、そのような一次データは生データとして保管するべきです。これは明確です。そこから論文の図への変換が一直線で、誰が行っても紛れがない話であればいいですが、往々にしてそこで議論があります。特にオミックスのようにデータ取得後の加工の部分の比重が大きい話だと、加工途中の中間ファイルも保存することが必要ということになると思います。これは、研究の再現性を高めていく上でも必要なことになるのかと思います。そして、一つの論文に関係するデータの数が多くなってきた場合には、それぞれのデータに関する情報、データ間の関係などの情報も記録されていることが重要になってきます。
田中 メタデータというか、注釈のようなものですね。コードの話も出ていましたが、その辺りをどこまで対応するのかです。今、言われたようにトレーサビリティというか、追跡できればいいということが一つの解釈ですね。
須谷 そうです。あとは、誰が行っても似たようになるのかどうかです。例えばエックス線結晶解析などは、生の回折像データをそのまま欲しがる人はまずいません。なぜかというと、解析の手法や利用するコードがしっかりとしていて、構造因子の値の算出がほぼ自動で行えるからです。あるいは、DNAシークエンシングもそうです。次世代シークエンシングも光の点の情報が最初のデータですが、そのような生データを欲しい人は誰もいません。画像データがATCGの並びに変換される過程に文句がつくことはありません。そうすると、シークエンス文字列を生データとして提出しましょうとなります。対照的なのは、先ほどお話しした神経の活動電位のデータのような場合です。まだフォーマットや解析の初期段階での処理過程が確立していないから、最初の重たいデータを提出してくださいとしか言えないところがあります。対象となる領域、データの種類ごとに生データの定義は変わってくるということになります。
田中 ビデオだとボリュームも大きいので、全てをおいておくことは本当に大変です。
須谷 はい。講演の中でも触れましたが、動画のようなサイズの大きなデータの扱いは厄介です。全てのデータを保存するのが現実的でない状況も徐々に出てきています。こういう場合にどのようにするのかについてですが、研究領域ごとにスタンダードがだんだんと決定していくのでないかと期待しています。
 須谷先生のお話に追加が一つあります。この議論の流れのときに申し上げるのが、データフォーマットが決まっているコミュニティーは強いという話をいつもしています。今もエックス線の話がありましたが、ケミストリーの世界でも結晶学と呼ばれるところでは、エックス線を取ってなんぼのケミストリーを行っています。それは1960年代からCIFファイルがあります。皆さんの中にはご存じの方もいるかもしれませんが、結晶学のデータについては、統一されたフォーマットをずっと蓄積してきた歴史があります。CIFファイルから論文まで書けるツールも、一時期はつくられていた時代もありました。
 例えば人文社会系でもIIIF、トリプルアイエフというものがあります。文化財などのデジタルアーカイブをするときの画像フォーマットが標準化されつつあります。そのフォーマットに従ったプラットフォームが出てくると、プラットフォーム間のコンパチビリティが次々と上がっていきます。少し下世話な言い方になって恐縮ですが、今後、研究者コミュニティーが発展していくためには、そのコミュニティーのデータフォーマットの標準化をどのように決めて広げていくのかも、一つの考え方としてあると思います。


田中 ありがとうございます。マイクを使ってOKですので、演者の1人は録画ですが、3人に質問があればフロアから受けたいと思います。
A- 私はどちらかというとファシリティに近い人間です。例えば論文をオープンサイエンスにして、プレプリントで出せばいいのであれば、無料でできることになります。多くの方は、そのために100万円などの不要なコストをかけています。要らないと言ってはいけませんが、自分たちの権利を守ることや、成果を見えやすくするために100万円を払っています。私たちのところでも、多くのデータが出てきます。日々、半自動で行っているものを人間が見直しながら、多くの結果を見返しています。また次の実験がきて、同じことを行います。山のようなデータを取り扱う中で、これとこれが論文の図面になったのでアーカイブを出してくださいと言われれば、それを出してきてアーカイブに出しています。
 ただし、先ほど言われていた生データの根拠や何でも、一つ変わるたびにコストが非常にかかります。大学病院でもコストがかかり過ぎて、皆がつぶれそうだと言っていると思います。私たちの所もコストがかかり過ぎてつぶれそうです。これがほしいと言って、お金を払ってくれる人はほとんどいません。装置ですら新しくするのが難しいのに、難しいことを次々と言われても、コスト的に無理です。コストについても、そのようなことをする人を雇うお金もありません。今も朝から晩まで一生懸命に働いている人たちに、さらに2倍の仕事をさせることもできません。ありとあらゆる意味でコストがかかります。
 先ほど言われたように、方法が全て確立していて、フォーマットを出してもらえばいいという世界については、私が考えている中ではありません。ロボットが全てを行ってくれるところについては、中国が先行しています。それではできないようなことを日本人が一生懸命に行うので、価値が出てくるという時代です。貧乏なので、そのようなことでしか日本人は生き残ることができません。次々とフォーマットから逸脱していって、できるだけとがったデータを出していかなければいけないと思います。次々とコストがかかっていくことに対して、何かしていただけることはありますか。
 歴史に習うと、産業革命時と非常に似ています。家内制手工業から工業生産に移った話が、今は科学の世界で起きているという話をよくします。言われたとおり、中国は大量生産をしています。知識生産ですら大量生産をするようになっています。一方で、家内制手工業がなくなったのかというと、全くそのようなことはありません。全く言われたとおりで、むしろハイブランドのものが生き残っていきます。日本の研究者はそちらに行くことについて、私も非常に同感です。そこにコストが必要なことも大変共感します。最後のスライドで、日本は面展開が重要とありました。目の前のことをしながら、新しいこともします。これはコストが倍とは言いませんが、1.5倍ぐらいかかります。
 実はこれは電子化のときも起きました。紙から電子にするときに、電子にするとコストが下がるのではなくて、むしろ一時的に並走するので、1.5倍ぐらいかかるという講演を20年前にしていました。話の落ちは何もありません。人はそのようなことを繰り返していく中で、あるリソースで工夫しながら乗り切ってきて、その場に立ち続けた者が勝ちます。そうとしか言いようがありません。これから政府が税金でたくさん投資できると言える日本の状況でもありません。その辺りが悩ましいと思います。
A- もう一つ思うことがあります。先ほどのトラストとルールは結構、一緒です。プレプリントでいいと言ってくれるなど、ルールがあるときの要らないコストについてです。要するに、PDFだけでいいと言うだけでコストが減ります。その意味では、コストがかからないルールづくりも、一生懸命に取り組んでもらえるといいと思います。
須谷 プレプリントの部分に関しては、研究者コミュニティ自体が業績評価、人物評価の一部としてピアレビューを求めているという側面があるので、一概に政府が上から決めるというのは実態にそぐわないように私は思ってしまいます。
 一方で、データを登録することのコストの方ですが、私たちはある程度は払っていますが、膨大なお金は払っていません。なぜかというと、Googleドライブを使っているのですが、アカデミアではある程度の範囲まで無償で利用できるからです。また、『Cell』系の雑誌に論文を通した場合、生データを公共のデータベースに登録することが推奨されるのをご存知の方も多いと思います。Mendeley Dataなどですね。こういうのも無償で利用可能です。お金をかけずにデータを保存管理する仕掛けは、構築可能、利用可能だと思います。
A- 定量研は須谷先生がいるのでできます。では、あなたの所はどうですか、ここはどうですかと皆がいろいろとすると、そこで全てにコストがかかります。皆さんがそれぞれ独自になって、データを渡すたびにそこに合わせなければいけなくなると、それもすごいコストがかかります。
須谷 おっしゃることはわかります。が、私も決してこの業務の専任な訳ではなく、本業の片手間でなんとか行えるよう努めているところです。やりようによって色々できることはあるのでないかなと思います。
 その議論を拾うと、図書館員が出版したものを、後からメタデータを付ける意味があるのかという議論があって、AIで全てできるのではないのかという話があります。これを全て省略すると、釈迦に説法になりますが、最初にデータが生まれたときに、全てにメタデータを付ける原理原則についてです。上流で付けるほうが絶対にコストがかからないという議論になります。装置から生まれたときに最低限の必要なメタデータを付ければ、そこからAIが文脈に応じて付加をします。人がわざわざ労働集約的にメタデータを付けなくてもいいのか、ここが今はまさに議論しているところだと思います。でも、Leslieさんの話があったように、最後は人が見なければいけないので、結局はそこでコストがかかるという話の落ちになってしまいます。そこで知恵と工夫でどのように切り抜けるのかです。
須谷 研究者の方にある程度は協力的に取り組んでもらわないといけないのは事実です。データを生み出した人の整理やラベリングがゼロではうまくいかないので、そこで協力がもらえるのかが大切です。それにはやはり、組織としてどういう姿勢で取り組んでいるのかが効いてくるよう感じます。つまり、上に立つ人の見識が問われるのでないかと思います。
A- 先ほど言われていましたが、若い方は協力的ということがあります。若い人ほどコストが理解できます。逆に、上に立つ人ほど理解できていないのではないかという気も若干します。
 その通りで、私が内輪の理事たちで集まるときに言うことは、若い人はこのような世界にいますと言います。くどいですが、今までのサイエンスは大事ですと言っているのは、まさにそこです。そこを否定すると、デシジョンメーカーがそっぽを向いてしまいます。でも、本気で思っています。これまでどおりのサイエンスはしっかりと続きます。先生がたのサイエンスも、デシジョンメーカーなので続きます。しかし、若い人は違うということをどのように理解してもらうのかが、実は結構、ポイントです。
A- 両先生、ありがとうございました。
田中 研究者側の人が今話題になったようなことを理解していないことが多いです。コアファシリティの話も出ましたが、その重要性についてです。オープンサイエンスを支える仕組みにはお金がかかりますが、そのこと自体が共有されていないことが大きいです。このセッションでもそのようなことを皆さんに共有して、いろいろな所でアピールしていただきたいと考えています。

B- 須谷先生の話を大変興味深く聞いていました。実際的なところで伺いことがあります。一つ目は先ほどの話と重なりますが、予算についてです。例えば10テラバイトのものを100本出すと、それだけで1ペタバイトになります。そうなると、ハードディスクの入れ替えがあります。映像にしても入れ替えがあります。テープであれば、テープのサーバーを用意するなど、とてもお金がかかります。そのようなデータは1年取っておけばいいものではなくて、例えば10年、20年です。20年は言い過ぎかもしれませんが、少なくとも10年は取っておきたいです。そのようなものを確保するときの予算についてです。例えば人件費などは、どこから出ますか。安定的に取ることができる仕組みがあるのか、それともないのかについてです。そのようなものがあるべきだと思います。
須谷 ありがとうございます。10テラバイトものが100本の世界になってしまうと、私たちも破綻してしまうと思います。今はまだそれが年に1本か2本です。なので、ハードディスク代の10万円、20万円をどこかから捻出して、研究所として賄っているという感じです。決して安定的な財源があるわけではないので、毎年なんとか工面してやっているという感じです。
B- そう考えると、全学的に使えるようにするとなると、どのように安定的に予算を確保するのかがとても大切です。私の研究室も100テラバイトのハードディスクが二つある状況です。
須谷 ハードディスクは怖いですね、故障でデータが飛んでしまうという意味で。
B- 怖いです。
須谷 故障のリスクを考えるとバックアップを取らなければいけません。また5年ぐらいたつと移し替えも考えないといけません。そうすると非常にコストがかかるなと感じます。LTOというのですか、テープに高密度にデータを保存するシステムも導入しつつあります。故障などによるデータ喪失のリスクが小さくなるのがメリットですが、すごくコストダウンするというわけではない感じです。例えば大きな情報センターが大学の中にあって、そのような所がイニシアチブを取って進めてくれる、そのようなことが起きれば状況は変わるのでないかなというようなことを考えます。
B- 実は理化学研究所にはそのようなものがあります。スーパーコンピューターに付いているテープドライブを、各研究室が有償で使えるので、今はバックアップで使っています。そのようなものが本格的にいろいろとあるといいと思います。
須谷 それは素晴らしい環境ですね。
B- 何か国内の研究者に広く提供される基盤があれば良いのですが。
須谷 その通りです。一方で、上が動くのを待っていてもなかなか進まないようにも思います。現場でいろいろな動き出しているところを実際に見てもらうと、それがきっかけとなって変わり出すということはあるのでないかなと個人的には思います。
B- ありがとうございます。あとは、実際的なところで二つ伺いたいことがあります。一つは実験ノートとの関係です。実験ノートと結びつくことではじめて画像データに意味があると思います。実験ノートそのものは、提出を義務づけていますか。
須谷 今はしていません。論文の個々の図に対応する生データがどれで、なんの装置で取得したかの記述があり、また解析途中の中間加工ファイルがあれば、生データから論文図を再現することはある程度できるだろうという想定で、現在は運用しています。もちろん、本来的には実験ノートも登録保存されるのがベターです。実験ノートを集めなくてもいいと言っているわけではなくて、各研究室で保管しておいてくださいというスタンスです。データ・ノートの登録の効用と手間の大きさを天秤にかけて、今のような運用ルールになっています。
B- ありがとうございます。もう一つだけあります。ZenodoFigshareですか。他にパブリックのリポジトリのサービスがいくつかあると思いますが、どのようにすみ分けをされているのかを教えていただきたいです。
須谷 各自でそういうデータリポジトリサービスを使うことは自由です。ただし、研究の論文を出したのであれば、そのデータは私たちにも提出してくださいというスタンスです。
B- Zenodoに出したデータもですか。
須谷 はい。公共のデータベースでも GEOPDBなど昔からあるものに登録されたシークエンスデータ、構造データなどは、少し違う扱いにしています。フォーマットの形式が確立していることや登録時にチェックがあることから、これらに登録した生データは改めて部局の方に提出する必要はないというルールです。一方、Zenodoなどのリポジトリサービスについては、現状では代わりとしないという取り決めです。
B- 分かりました。ありがとうございます。

C- 面白い話をありがとうございました。私は大学でベンチャーも行っていて、その観点で質問します。まずは、林先生の話についてです。本日、話されたのは、ほとんどは論文の話です。ペーパーについてです。企業ではパテントが本当の肝です。私はいろいろとパテントとオープンサイエンスのことを考えています。完全にオープンサイエンスにしてしまうと、日本の企業が全てアウトになって、どこかの国が大きくなってしまう感じなので、私がパテントを出すときはかなり考えます。例えば本日の須谷先生の話で、論文を書いてひと月で全て公開してしまったときです。それで誰かが悪いことをすると、全てが駄目になります。ご存じだと思いますが、日本では1年以内であれば、論文、パテントを出せます。後で戦いになったときは、ずっとノートを見ていけば、いつかはこちらが勝つと思いますが、相手がとても大きいときにベンチャーは太刀打ちできません。そうなると、オープンサイエンスで全てのデータをひと月で出すことについてです。先ほどの話について、私はしばらく出さないのだろうと思っていましたが、すぐにオープンにしてしまうという言い方をされてしまっていたので、それをしていてよくできているなと思うことが一つです。
 それから、林先生の話についてです。特許は経済産業省だと思います。今は文部科学省として、その辺りのせめぎ合いがどのようになっているのかと思いました。学生がドクターの論文を書きます。ドクターの論文を書くと、それをすぐにオープンにしなさいと、必ず大学が言ってきます。私はそこで、私たちはせっかく半分ずつで行っているので、1年は論文を出せませんと言っています。パテントにする意味がない研究であれば1年で出します。そのような形で断っています。文部科学省の方はその辺りを本当に理解しているのかと、私はいつも思っています。トップの方は理解されていて、どこかから理解を省略してしまっているかもしれません。事務がいろいろと言ってきます。そうすると、何回も言っているでしょうという話で、こちらも徐々に腹が立ってきます。愚痴のようになってしまいました。その辺りはどのようになっているのか聞きたいです。
須谷 ありがとうございます。聴衆の中に工学系の方、パテントが関係する方は、あまりいないだろうという前提で本日はお話をしましたので、そういう観点は省略してしまっておりました。工学系の方と話をすると、論文が出たからといって全てのデータをオープンにできない、そのような方がいることはよく存じています。今、私たちの部局でデータ登録・公開の取り組みができているのは、私たちが基礎の生物学者で、パテントが絡むことが少ないからです。知的財産を守らなければいけない場合は、もちろん全く話が違うと思います。私たち自身のところでもその辺りは杓子定規で進めるつもりはなくて、これはパテントなのでどうしても待ってくださいと言われれば、待ちます。あと2つ付け加えさせてください。現在の私たちの部局での運用では、データの公開は部局内限りです。将来完全オープンにすることも視野に入れていますが、現在は論文受理後1ヶ月ですべての生データが公知になるという運用はしていません。一方で、基礎生命科学の雑誌では、論文受理とともに生データも公開しましょう、というようになってきていると思います。一流誌であるほどそういう傾向があります。パテントが強く関係する研究領域とは相性が悪いトレンドですが、世界的な潮流として基礎研究分野ではそうなっているということは指摘しておきたいなと思います。
C- ただし、特許について、基礎のことを言われても、実は基礎が最も大事です。最もベーシックなところがなければいけません。それを応用しただけのパテントを取っても薄くなってしまいます。周りからいろいろなものがくるので、私は基本データのところは必ず持っています。基本データの最も大事な最初のところをオープンにしてしまう場合です。例えば本庶先生のPD-1も、先に出てしまっていたら、本庶先生は特許を取ることができていません。どこかで他の会社が入ってしまうと、それでアウトになるので、そこは本当に気をつけなければいけません。
須谷 これは、生データの中に「今回の論文では触れなかったが、大事な発見がまだ隠れている」というので出したくないということでしょうか。それとも何か違う理由を考えておられるのか‥。ちょっと質問者の意図を十分汲み取れておらず、的確な答えが浮かびません。ただ、次のことは言えるかと思います。今思い浮かべているのはNatureCell系列のものとか、J. Cell Biol. のような学会誌ですが、これらでは論文の内容の再現性を重要視する方向に進んできていると思います。だからこそ、論文の生データもオープンにしましょう、ということになるわけです。ですので、そういう雑誌を考えているのであれば、まずは特許をしっかり出願してから論文を投稿する。その際に生データを出すのは受け入れざるを得ない、そういうことになるなるのでないかと思います。
 まずは、言われていた見立てと所作は、何もおかしなことではありません。順を追って説明します。例えば博論に関しても、今はオープン化されています。博論は2013年ぐらいにオープン化されていますが、理由がある場合はオープンにしなくてもいいです。それをオープンデータのところで杓子定規に進めてしまっていると感じました。オープンアクセスもオープンデータも博論のオープン化も、あまり大きな声では言えませんが、実は必ずエスケープルートが用意されています。それは研究者コミュニティーに応じて、あるいは同じ研究者コミュニティーの中でも、それぞれの研究トピックにおいて、全く違う扱いがあることを私たちは理解しているからです。しかし、言われていたとおり、運用するところでオープンが先走り過ぎると、そのような形でストレスを与えてしまうケースが出てきていることを、あらためて思いました。
 あとは、そこから二つに分かれます。まずは、経済産業省に関してです。これは今のホットトピックですが、特許というよりも研究のセキュリティーやインテグリティのほうが今はつらいです。皆さんの研究データを日本の外に出すときに、今はいろいろな規制が掛かり始めています。単なる正論ですが、産業や知的財産を守るベクトルと、サイエンスを発展させて日本の研究力を上げるという、相反するベクトルの中でバランスを取ることです。ある程度は綱引きをするので、その中の平衡点が建設的なところになるようなところを、日々、繰り返しているのが現状です。繰り返しになりますが、都度のオペレーションに落ちるときに、いろいろとおかしいことが起きてしまうのも、組織運営の中であると思います。
 最後です。私がオープンサイエンスについて言いましたが、知的財産系について同じスライドで話すと、もっとクローズで先ほどと同じです。論文はオープンにするものなので、その根拠データはオープンにできるということですが、研究データをアセット、研究資源戦略として、大学としてはそれを大学の経営資源戦略として扱いましょうということで、同じスライドで全く違う話をします。そのときに先ほどの話と絡めて言うと、これからは実験ノートが非常に大事になってきます。エレクトロニックラボノートというものがあります。製薬企業ではずっと前から始まっていますが、そこに第三者のタイムスタンプを付けてあげれば、特許制度が変わるという話をしています。要するに、先願主義から先発明主義に戻ることができるということです。なぜならば、ブロックチェーンを使えばなおさらですが、このときにアイデアや実験を行ったものが、第三者的に保証できるものがしっかりと管理されていれば、知的財産の世界のゲームチェンジが起きるという話があります。これをどのように取りにいくのかの話をすることもありますが、現実は言われていたとおり、論文を出しながら1年間で特許を取ります。今の仕組みの中でどのように取るのかという所作は、私は正しいと思っています。
D- 今の話について、簡単な質問が一つあります。そうすると、サブマリン特許がまた復活するという理解でいいですか。アメリカで訴訟の大ネタがあります。
 その辺りの整理についてです。新しい秩序やゲームが変わることは、まさにそのようなところです。
D- 今はデータを公開しようという話で、皆さんは公開のことを言っていますが、期間はどのように想定していますか。個人の責任にする場合です。なぜこれを言うのかというと、昔にNEDOの委員会にいたときに、NEDOプロジェクトでたくさん立ち上げたデータベースがあります。研究者がいなくなると、どこにいったのかが分からなりました。そうすると、いっぱいになって、どれとどれが残っているのかについて大調査をしたことがあります。それと同じで、ラボ単位で行っていても、ラボの教授が定年になったときはどうなるのか、個人で行っていてもその方が研究を止めてしまうなど、不慮の事故などが起きた場合にどのように対応するのかについて、将来的にどのように考えているのか、それを伺いたいです。
須谷 あまり深く考えたことがありませんでした。一般論としては、文部科学省のガイドラインにのっとれば、研究論文が出た後の保存期間を定める必要があります。大概の場合は10年間、データや実験ノートは保存されていなければいけないという運用かと思います。ただし、その教授が辞めた後とか、不慮の事故で亡くなられた場合とか、そういうことまで踏まえた現実的な設計というのはなかなかなされていないかもしれません。今後の課題だと思います。
 私たちの部局のデータ管理についていえば、本来は研究室単位で管理されるべきデータのバックアップを研究倫理推進室でも預かっているというスタンスです。それでも、できるだけ永続的に、少なくとも10年間は保管をするという方針での運用を考えています。
D- 継続性の部分ついて、今後は考えていただきたいというのが私の希望です。
 ご指摘の通りです。これも歴史に習うと、実は図書館がそれを紙で行ってきています。館の数しか本を入れることができないので、それ以上のときです。あるいは、定年退官されると一気に蔵書がきます。そうすると、どれを残すのかについてです。学術ジャーナルが生まれてからで計算しても、三百六十何年の歴史があります。そのデジタル版に私たちが向き合っていると考えた場合です。先ほど10テラバイト、10ペタバイトの話がありましたが、あれも結局は、今の議論はどれを残さないのかです。どれを残すのかではなくて、どれを残さないのかが、より本質的な時代になっています。これは単にデータ量ではなくて、最後はエネルギー問題になります。データ量ではなくて電気代です。そこに関して、トリアージ的な考え方を、今後はデータにおいてせざるを得ません。そのときにどれを残すのかです。言いたくありませんが、どれを捨てるのかについて、コミュニティーでどのように決めていくのかが、非常にシビアになってくると思っています。

田中 オンラインから須谷さん向けの質問があります。将来的には実験ノートもアーカイブするという話が出ていました。これの精査について、具体的にどのようなイメージでやるのですかという質問がありました。
須谷 実験ノートを精査するようなシチュエーションは起きてほしくありません(笑)。きっとそれは何か不正事案が起きた時になるのだと思いますが、実際に起きると、本当に人海戦術になると思います。今の時代であれば、AIを使えばだいぶ省略できるかもしれませんが‥。過去の不正調査の時には私は側でなんとなく様子を見ているだけでしたが、実際に取り組んでいる先生方は本当に大変そうでした。本来はそういう調査を職とする人がいてもいいはずですが、日本は所属組織の人がボランティアで行うシステムなので、一度ことが起こると本当に大変です。

田中 ありがとうございます。私の整理が悪くて、時間になってしまいました。本日はオープンサイエンス時代の研究者像はどのようなものがいいのかについて、パネリストのみなさまにコメントを用意してきていただいています。それで締めとしたいと思っています。須谷さんからお願いしてもいいですか。
須谷 私たちは過去にあった不正事件への対応から、自分たちの研究データを登録、保存しましょうというプロジェクトを始めました。でも、これを行っていることが、精神衛生上ですごく自分たちのためになっているのでないかということを、今回のトークを準備していて、あらためて感じました。この会場に同じようなデータ保存の取り組みをしなければとか、してみたらどうなるかなとか、そのようなことを考えている方がいるのであれば、ぜひ行ってみてはとお勧めしたいと思います。オープンサイエンス時代を生き抜くためには、自分のデータを守ることが大事です。それは結局研究者としての在るべき姿そのものだとも思います。この会場に集まってくださった方もおそらく同じような気持ちを共有しておられるのでないかなと感じました。最後までお聞きいただきありがとうございました。
 マトリクスを描きます。こちら側が知的財産に遠い人、こちら側が知的財産に関連が強い人です。下にいくほど論文に依拠しています。上にいくほどデータに依拠しています。このようにマトリクスを描いてあげると、オープンの戦略の仕方が、フルオープンからあえて囲うまで、いろいろなポートフォリオが組めます。くどいですが、同じ関係者でも、もらう研究費や研究テーマによって、知的財産に寄るときもあれば、論文やデータに寄るときもあります。個々人の中で研究のポートフォリオを、デジタル時代において捉え直すよい機会だと思っています。その中で最適化をすると、皆さんの意見をすくって、次のPDCAサイクルになるのか、処世術のような話です。本当はサイエンスがもっとオープンであるべきという話をしたいですが、あえて技術的な話をしました。
木村 私は日本生化学会の倫理教育委員長という立場で参加しており、実はAIのことは全く分かっていません。私は地方大学の研究室を持っておりますが、マスターまでしかいかない学生がほとんどです。1本の論文が代々受け継がれてから完成することが多く、前の代の学生のデータを受け継いで進めるのでとても手間が掛かります。前の人のデータがきちんと残されておらず信用できないと、次の人が同じ実験を行わなければいけません。今回、お話していただいたように、次の人の実験が下手だと、それがまた止まってしまうことがあります。今、描いていただいたように、このようにデータがしっかり管理されていれば、逆にエネルギーが省略できるのではないのかと思いました。ありがとうございました。
田中 ありがとうございます。私が今回のセッションを設けた理由の一つは、研究不正の話です。今は研究評価の在り方が非常にまずいです。評価が論文に非常に偏重していて、そのためにいろいろなゆがみが出ています。研究活動は論文発表だけではありません。データベースを整備するなど、さまざまな側面があります。それに対しては、無自覚な人が多い気がしています。オープンサイエンスは研究のさまざまな側面に対して、全てに光を当ててオープンにしていきます。そうすると、研究者の評価も変わります。あるいは、研究者それぞれのやりがいの持ち方も変わると思っています。その辺りをここで共有して、また皆さんの所に持ち帰っていただけると最もよいと思います。文部科学省が進めてほしいという話が多いです。そうではなくて、私たちから良い研究をするためにはこのようなものが必要で、このようなことに取り組んでいかなければ駄目という声が上がるほうが健全だと思っているので、ぜひご協力いただきたいです。
 本日はお忙しいところ、パネリストのみなさまには素晴らしい講演をいただきました。本当に時間が短くて誠に申し訳ありませんでしたが、ありがとうございました。フロアの皆さんも本日は積極的に議論いただき、ありがとうございます。
一同 ありがとうございました。