研究の位置づけを明確にする集中型の論文サーベイ方法
博士課程に進学し、国際会議に論文を投稿した際に行った論文サーベイの流れやツールについてまとめておく。 今回のサーベイを行うにあたり、既存研究に対する自身の研究の位置づけを明らかにすることを目標とした。 すなわち、自身の提案がある程度カタチになっていることを前提とした集中的サーベイ方法である。
論文サーベイの流れ
以下に行った工程を示す。
- 会議名とキーワード検索による候補のリストアップ
- 各候補のアブストラクトによる選定
- 各候補の精読
- 必要に応じて参考になる会議名、キーワード、参照論文を候補に追加
- 候補がなくなるまで繰り返す
以降、各工程について利用したツールや工夫などを述べる。
1. 会議名とキーワード検索による候補のリストアップ
サーベイは十分な量の候補を必要とする。 自身の研究分野や貢献と完全に一致する論文は多くはないが、全くゼロではない。 もし多すぎるのであれば、自身の研究の貢献や目的が十分に掘り下げられていない可能性がある。 もしゼロであれば、自身の研究に有用性がないか、十分な調査ができていないかもしれない。 自身の研究を信じる我々は、いずれにせよ十分に候補を見つける必要がある。
候補の選定には、Google Scholarによるキーワード検索を用いる。
なるべく多くの論文を候補とするため、キーワードは関連しそうなキーワードを複数挙げて、ORで繋ぐと良い。
この時、指導教官からのアドバイスで会議名を絞って検索するようにした。
これは、検索クエリに source:SIGKDD
などと指定することで実現できる。
そして、検索結果から以下の情報をリスト化する。
- Title
- Citiations
- URL
- Authors
おおよそ、Google Scholarではキーワードへの関連性が高いものから並べてくれているため、会議ごとに上位20-50本程度を候補とすれば十分であったように思える。
リスト化にはGoogleスプレッドシートを利用した。後の工程のため、関連有無フラグとメモ欄をカラムとして追加する。
なお、検索〜リスト作成は手動では面倒なので、スクリプトを用意した。
2. 各候補のアブストラクトによる選定
1.でリストアップした候補について、精読すべきかの選定を行う。 なお、選定はアブストラクトのみで行うこと。 ここで、個別に精読を始めると時間がいくらあっても足りないからである(逆に言えば自身の研究もやはりアブストラクトに提案と貢献をしっかり記述する必要がある)。
選定基準は自身の研究や提案、貢献に関連がありそうかとする。 また、いくつか読んでいく中で判断基準が徐々に形成されていくので、効率よく見直せるよう、メモを書いておく。 メモには、どういう提案や手法かを一行程度書けば良い。 精読すべきと判断したものには、リストに丸をつけ、フィルタなり色付けして候補を見つけやすくしておく。
3. 各候補の精読
2.で選定した精読候補を読み、まとめる。 多くの論文を読まなければならないこと、最終的に自分の研究との相対的な位置づけを整理する必要があるため、効率よく見直せるようまとめを残す必要がある。 まとめがないと何度も同じ論文をイチから読み直す必要があるので絶対にまとめること。 以下にまとめの観点とこれを実現するツールについて示す。
まとめの観点
まとめの粒度や項目が統一されていることが望ましい。 自分は、落合メソッドをアレンジして使っている。 つまり、自分の研究の位置づけを整理するのに適した問いかけにしている。
- どんなもの?
- 先行研究と比べてどこがすごい?(どんな課題を解決する?)
- 技術や手法のキモはどこ?(どうやって解決した?)
- どうやって有効だと検証した?
- 議論はある?(自分の研究との差異は?)
- 次に読むべき論文は?(他に知らなかった技術や概念は?)
括弧内が自分用の問いかけである。 特に、「議論はある?」を「自分の研究との差異は?」に置き換えることで位置付けの整理を強く意識したまとめができるようになった点が気に入っている。
まとめのためのツール
これまで論文管理には、Mendeleyを利用し、PaperShipと同期、必要に応じてiPadで書き込みを行っていた。
しかしながら、今回まとめにはNotionを別途利用した。 Notionは、論文への直接書き込みの場合の、十分な余白がない点や論文同士の関係性を横串で把握しにくかった点を解消してくれる。 Notionで、上述のアレンジ版落合メソッドを含んだテンプレートを用意し、サーベイDATABASEに論文ごとに1ページ作り、読みながらまとめを作っていく。
この時、最初からまとめようとすると論文全体を覚えておかなくてはならないので、自由に記入可能なメモ欄を用意して、読みながら、そちらにわかったこと疑問に思ったことなどを気楽に書いて、最後にまとめる方法をとっている。 メモ欄も残したままにしておくと後から読み直した時に記憶が蘇りやすいのでそのまま残している。
また、Notionでは各ページに対してPropertyを付与することで絞り込みができるため、会議名タグ、論文の発行年度、論文のURL、その論文を読んだ日付、キーワードのタグをPropertyとして設定している。
4. 必要に応じて参考になる会議名、キーワード、参照論文を候補に追加
精読の中で、気になる会議名、キーワードが追加された場合、もう一度、1.の検索に戻り候補を追加する。 また、参照されている論文も候補に追加する。
コツとしては、追加された候補に対してすぐにアブストや精読を始めずに、候補として追加に止める事。 この追加した候補はまた新しい候補を増やすので、ゴールが見えなくなってしまうからである。 なので、最初に決めた候補まで読み切ってから、新しい候補の処理に着手すると気分的に進捗感が出て楽であった(これはまあ人による)。
5. 候補がなくなるまで繰り返す
以上を候補がなくなるまで繰り返す。 参考文献が参考文献を呼んで終わらないのではないかと思われたが、2-3周もすれば新しい文献も出てこなくなってくる。 まとめの中で自身の研究が位置付けられてくるので、そこを一旦の止め時とした。
まとめ
国際会議への投稿にあたって、自身の研究の位置づけを明確にするための論文サーベイの方法をまとめた。 今回は、最初のリストが243本、精読が47本であった。 会議を分けてサーベイすることで会議ごとに同じキーワードでも論文に特色があることなどが分かり興味深かった。 また、トップカンファレンスに限ることで、サーベイ効率も高まったと思う。 指導教官に感謝である。
Notion上の47ページの論文まとめは執筆中、何度も読み直したが自分なりのまとめメモが入っていること、自分の研究との位置づけが一言でまとめられていることから、効率よく記憶が蘇らせることができた。 結果として、複数の論文同士の関係性を整理するという目標に自身のリソースを采配することができたと思う。
一方で、キーワード検索では、既読管理と相性が悪いため、普段のインプットとしての継続的なサーベイには向かない。 RSSフィード的なインプットの方法を探したい。