https://okuno.net/ja のおまけ.ときどき更新の予定で,順番などはてきとう. 数理統計~機械学習村のならわしに準拠しています.内容は我流のものが含まれますから,盲信せず参考程度にしてください.要望などありましたら直接お問い合わせください.
神嶌先生のwebページにあるpdf (http://www.kamishima.net/archive/MLDMAImap.pdf) を見ると分野ごとの有力な国際会議が分かります. 自分は統計的機械学習が好きなので,良く読むのはLearning Theory, Machine Learning, Artificial Intelligenceに該当するICML, NeurIPS, AISTATS, IJCAI, AAAI, ICLRなどです. 画像処理 (Computer Vision; CV) を専門にしている人はICCV, CVPR, ECCV, ICPRなどを読むでしょうし 自然言語処理 (Natural Language Processing; NLP) の人はACL, EMNLP, NAACLなどを読むのだろうと思います.
CORE Portalで会議のレベル (Rank) が検索できます. 一概には言えませんが,一般的にはRankの高い会議ほど査読が厳しく良い論文の割合が多いとされています. 例えば機械学習のトップ会議であるICML (International Conference on Machine Learning) を検索してみると
となりRankがA*と分かります.A*,A,B,Cの順でRankが下がり, A*とAが「トップカンファレンス」と呼ばれる一群,Bが「2nd tier」,Cがそれ以下です. 基本的にはA*とAを読めばよく,Bまでは許容範囲ですが,C以下になると査読が全く機能していない論文の割合が大幅に増えますので,できれば避けたほうが良いでしょう.
私は上記のCORE PortalとGuide2Researchをよく参考にしています.
Google scholarが提供する刊行論文のインパクトのリストも参考になります.これは人工知能 (Artificial Intelligence) 分野でのリストで,
例えばcomputational linguisticsやoperations researchといったsubcategoriesごとのリストも出ているので,
興味ある分野にしたがって適宜参照してください.
これらの評価は毎年変わりますし,分野や母集団が異なると単純に比較できるものでもないので,あくまで目安として使ってください.
良さげな国際会議が見つかったら,次はProceedingsを探してみましょう. Proceedingsとは論文のまとめ集のようなものです. 例えばGoogleなどで"ICML proceedings"と検索してみると,
Proceedings of Machine Learning Research (PMLR)のぺージが出てきます. PMLRのページを開くとVol. 97がICML2019の特集になっているので,リンクをクリックすると論文の一覧が表示されます.
タイトルと著者名が表示されています. この中で興味を惹くタイトルがあれば [Download PDF] を押すと論文が表示されます.適宜ダウンロードして読みましょう. Proceedingsは会議ごとに発行する場所が違う場合があり,また一部の会議論文は無料で読めない場合もありますので注意してください.
ある程度研究のキーワードが分かってくると, 論文検索に特化したGoogle scholar (https://scholar.google.com) を使って論文をキーワード検索することもできます. 例えば"autoencoder homology"の2つのキーワードを入れて検索してみると
関連した論文が表示されました.リンクをクリックすることで当該ページに飛ぶことができますし, 右側に[PDF]が表示されている場合は直接pdfをダウンロードできることもあります. 私の指導教員の下平先生が書かれたブログ記事も参考になります.
発表スライドを作るときよく使われるのはPowerpoint, Keynote, Beamerなどです. Powerpointは図を入れやすいが綺麗な数式を入れにくく, Beamerは数式を入れやすいが図を入れにくい気がします.用途に応じて使い分けましょう. スライドデザインについては,たとえば書籍 [学生・研究者のための使える!PowerPointスライドデザイン 伝わるプレゼン1つの原理と3つの技術] などを参考にしてください. その他にも [伝わるデザイン] などのwebページが役に立ちます.
発表内容を充実させるのはもちろんのこと,ここでは忘れがちな,発表で守るべき3つのポイント: (1) タイトルに情報を詰め込む, (2) ページ番号を記入する, (3) 参考文献をきちんと引用する, について紹介します.
(1) タイトルに情報を詰め込む
タイトルページには発表タイトル・自分の名前・日付と発表場所 を入れましょう.
このスライドには載せていませんが,2行程度の簡単な概要などを書いても良いかもしれません.論文紹介の場合は,タイトルページに紹介する論文の文献情報を書くとよいです.
(2) ページ番号を記入する + (3) 参考文献をきちんと引用する
スライドにはページ番号を入れましょう.ページ番号を入れていないと,発表についてのコメントを受ける際にどのページを開けばよいか分からず困ることになります.
また,スライドで既存の定理や概念を利用する場合には必ず引用情報を記述しましょう.基本的には「その概念を提案したオリジナルの論文」を引用すべきですが,よく知られた一般的な概念であれば最近の教科書やサーベイ論文などを引用する場合もあります.発表時に説明しきれなかった場合,当該論文にさかのぼり主張が正しいかどうかその場で検証が行われることもありますので,「どこの文献を見て書いたのか」をきちんと書いておきましょう.
発表スライドの最後には参考文献の一覧を載せます.引用した文献を全て載せるようにしましょう.
引用情報は,たとえば [3-1 Google Scholarから探す] で紹介したようにGoogle scholarで論文検索し,ダブルクオーテーションマークを押して出てくる書誌情報(「引用」)からコピーするとよいです.APA/MLAなど様々な引用方式がありますがどれを使えばよいかは場合に依っていて,研究室内の発表では,一貫したフォーマットを利用する限りどれを使っても問題ありません.私は基本的にはAPAのフォーマットを使っています.
現在,多くの学術機関においてファイルの標準的なフォーマットは
.pdf
です.論文もpdfで配布されるし,多くのスライドもpdfで配布されています. またPowerpointやKeynoteは有料のソフトウェアですから,ソフトを所有していない人はファイルを開くことができず,ファイルを配布する際に固有の拡張子
.pptx
などとするのは好ましくありません.
.pptx
ファイルは文字の配置などが実行環境に依存するので,Macで作成したファイルをWindowsで開くと大きく文字化けしたり,位置がずれてしまう問題もあります.したがって,多数の人が閲覧する研究室のslackやgoogle driveにファイルをアップロードする場合は, [PowerPointファイルをPDF形式に変換する2つの方法] などを参考にして,必ず
.pdf
に変換してください.アニメーションを利用する場合は,pdfでアニメーションが消えた場合でも正しく意味が通るように注意してください.(なお,私はスライドでアニメーションを使いません)
資料のweb公開時や対外的な発表時に,一部画像をお見せできない場合などがあり,その場合は黒で塗りつぶすか,画像にモザイクをかけたりして対応します.以下ではWindowsでは標準的にインストールされているペイントでモザイクをかける方法を紹介します. なお,この記事ではいらすとやの徳川家康の似顔絵イラストを利用しました.
モザイクをかけたい画像をペイントで開きます.
次にモザイクをかけたい部分を「選択」します.
「選択」した四角形の右端の四角を左上にドラッグして, 小さな正方形まで縮小します.
ドラッグ状態をやめ(縮小した状態でマウスから指を離す)て, 再び右下の四角をドラッグして引き延ばします.
これでモザイクがかかりました.
学会発表には,機械学習系の国際会議など [論文を投稿し,査読を通れば発表ができる] 形式のものと多くの国内会議など [タイトルと概要を投稿し,申し込んだほとんどの人が発表できる] 形式のものがあります.ここでは後者を扱います. 多くの場合,発表申し込みに必要なものは発表タイトル,所属や連絡先といった共著者情報,研究を表すキーワードいくつか,研究概要数百字程度,です.必要な情報は学会により異なりますので,発表申し込みをする前に確認してください.それぞれについて注意点をまとめておきます.
(1) 発表タイトル
発表タイトルは研究の中身を明確に想像でき,かつ過剰な表現にならないよう注意しましょう.たとえば単に「回帰分析に関する研究」では回帰分析の何を調べたのかが分かりません.分野によりタイトルの表現の強さに温度差がある場合もありますから,発表経験のある人にタイトルを確認してもらうことをお勧めします.また学会は発表タイトルを公開していることも多いですから,前年度の発表タイトルを調べて感覚をつかんでみるのもよいと思います.(cf. 2020年度の統計関連学会連合大会タイトル例)
(2) 所属や連絡先といった共著者情報
記入する所属や連絡先を共著者全員に確認するようにしてください.研究者は2つや3つの組織に所属していることがあり,またそれぞれで共同研究など報告義務がある場合もありますから,発表時に所属をすべて表記していないと後々問題になることがあります.
(3) 研究を表すキーワード
例えば数学なら Mathematics Subject Classification (MSC) などが参考になります.キーワードの選定は悩みどころですが,色々な記事もありますので参考にしてください:
editage,
AJE.
(4) 研究概要
研究概要には主に,研究の背景,既存法の問題点,問題に対してどういうアプローチを取ったか(貢献),などを簡潔に書きます.発表する研究の貢献が何なのか明確に書きましょう.以下に例を載せます:
研究概要を初めて書くと「研究の背景」をダラダラ書きがちですが,問題点を説明するため必要最小限の説明に留めてください.
研究発表で重要なのは「問題点が何か」と「この発表の貢献は何なのか」という点です.問題点など発表を聞けばわかるよとか,論文を読めばわかるじゃないですか,という気持ちになりがちですが,色々なバックグラウンドを持った分野外の人が聴衆にいることが普通ですから,いかに簡単なことだと思っても問題点や貢献を明示するようにしてください.
また,学会発表でも研究倫理が求められます.他の研究ですでに示されている内容を新規の貢献とすることはできず,研究を正しく位置付ける必要があります.もし少しでも不安なことがあれば,シニアの共著者や指導教員にすぐ相談するようにしましょう.
貢献についてはできるだけ詳細な状況が分かるようにしましょう.私がよく気にするのは,例えば「手法Aの優位性を示した」というような状況で理論的な解析をしたのか,実験によりパフォーマンスを比べたのか,という点です.実験であれば,人工データなのか,巨大な実データなのか,など状況を詳細に書くとより良い概要になるかと思います.
以上書いたことは"最低限"気を付けるべきルールであって,他にも表記ゆれや分野ごとの言葉の使い方の違いなど気を付けることは多々ありますから,良く書けたと思っても必ず共著者にチェックをしてもらうようにしましょう.
以上の内容を,共著者全員に確認を取ったうえで申し込んでください.確認には数日かかることもありますし,修正が入ることもありますから,締め切りの数日前~1週間前くらいには確認の作業に入ることをお勧めします. また申し込み時の最終的な登録情報は共著者全員に共有するようにしてください.発表申し込み後に来たメールを全員に転送すれば十分です.
Overleafはデフォルトでは日本語を出力してくれませんが
.tex
ファイルのPreamble部 (
documentclass
のすぐ下で
usepackage
を書くところ) に
usepackage[whole]{bxcjkjatype}
と書くだけで日本語が出力されるようになります.
LaTeX-CJK https://texwiki.texjp.org/LaTeX-CJK
書誌情報を探すとき一番手っ取り早いのは Google scholar (https://scholar.google.com) を使う方法です. キーワード検索などをして論文を探すと,各論文の左下にダブルクオーテーションマークが出ます.
ここを押すと以下のように書誌情報が表示されます.
この中でBibTeXと書かれた部分を押すと,bib情報が表示されます.
コピペして使いましょう. 一方で,Googleは様々なwebページの情報をもとに書誌情報を自動生成しているようで,
表示される書誌情報がおかしいことが多々あります.目視で確認して手動で修正するなど注意して使いましょう.
[A-1-3 Proceedingsを探す] で紹介したようにProceedingsから論文を探した場合は, 各論文のAbstractのページに飛ぶとBibTeXの情報が公開されている場合があります.
Proceedingsなどに表示されているBibTeXは公式で精度が高いので,Google Scholarよりもこちらを優先して使いましょう.論文の著者が個人ページでbib情報を公開している場合もあります.
英語を生業とするならいざ知らず,我々は(主に)数学や情報を専門とする人間であって,足りない英語力を文明の利器で補いながらどうにかして英文を捻りだし,校正して出版までもっていく必要があります. ここでは主にGoogle scholarとThesaurusを利用した,最低限知っておくべき小手先の校正テクニックついて説明します.
英語論文を書く上で最も重要となるのはGoogle scholar (https://scholar.google.co.jp/) によるパターンマッチングです.ここでパターンマッチングはダブルクオーテーションマークで文章を挟んだ"(文章)"
での検索を指します.
たとえば,「ある可視化されたデータが3つのグループに分かれた」という状況を説明するとき,"the visualization were separated"という文章を書いたとします.Google scholarでパターンマッチングした結果は
となり,論文では全く使われていない用法であることが分かります.ここで例えば"visualization"を"images"に変更してみると,
であり,何やら"the images were separated into *** groups"のように書かれた文章が出てきました.先ほどの文章は既存の論文では全く使われていない言い回しだったようですから,変更した文章は以前のものよりは良いであろう,ということになります.
この文章もヒット件数は500程度しかなく,あまり信用がおけるとは思えませんが
手を変え品を変えて言い回しを工夫しながらGoogle scholarのパターンマッチングを繰り返し,同様の意味で使われている論文が多くなるような言い回しを探せば,そこまで変な英文を書くことは少なくなるでしょう.
言い回しを工夫するためThesaurusを利用する方法は [C-3-2 類語を探す] で紹介します.
情報処理の基礎を学んだことのある方はご存知かと思いますが,ワイルドカードの記号 *
は,当該箇所に任意の文字列を勝手にパターンマッチしてくれます.たとえば"we aim"という語を使い,「我々は~~を減らしたい」という文章を書きたいのだけれども続く前置詞が分からない,といった場合には,"we aim * reducing"のように検索すれば
当該箇所を補間した文章が検索されます.上位3つの文章では"we aim at reducing"がヒットしていますから,atを入れればよいことが分かります.この用法は特に前置詞が分からない場合などに便利ですが,フレーズの検索時に固有名詞を無視したいとか,色々なことに応用できるので覚えておいて損はないでしょう.
なお,本節の内容は [C-3-3 参考になる本など] で紹介するGoogle 英文ライティングの本にも詳しくまとまっています.
類語辞典(Thesaurus)を利用すれば単語の言い換えをいくらか検索することができます.
私がよく利用するのはThesaurus.com (https://www.thesaurus.com/) です.たとえば"tell"を検索してみると,
のように同様の意味で異なる単語がたくさんヒットしますから,同様にして文章中の各単語をより良い単語に置き換えましょう.
文章中の単語をThesaurusで書き換えて,[C-3-1 文章のパターンマッチング] で紹介したようにGoogle scholarでパターンマッチングする,という操作を繰り返し満足いく文章まで到達できれば(セルフ)英文校正の完了です.
巷には,英語論文の書き方についてまとめた本がたくさん売られています. どれを買ってよいか迷うほどです.参考までに私が良かったと思う本をいくつか紹介します.まず私が全員におススメしているのは
です.1500円程度で購入できる160pほどの薄い本ですが,英語論文を書く上での作法などが必要最小限でまとまっており,英語論文執筆が決まればまず一冊購入して読むべきかと思います.その次にお勧めするのは
です.こちらは [C-3-1 文章のパターンマッチング] で紹介したテクニックをより詳細にまとめた本になっています.以上が(現代的に)英語論文を書く上で最低限読んでおくべき2冊かと思います.ここに付け加えるならば,英文を書くときにパラパラと参考にできる本として,シチュエーションごとの英語表現と重要動詞をリストして詳解した
の2冊かと思います. 500p以上ありまだ私自身ほとんど目を通せていませんが,2019年末に和訳が出版された
なども英文ライティングの定番として評価が高いようです.通しで読むには分量が多く,内容も細かいようですから,他の本を読み何本か論文を書いた後で読むのが良いかと思います.なお原著のUseful PhrasesセクションがSpringerで無料公開(*pdf注意)されており,大変参考になります.ある程度英語が苦にならなければ,英語でのフレーズ集や,そのDiscussionなども検索して参考にすればよいでしょう. その他にもたくさんの本が出版されていますから,Amazonで検索するなどして良い本を探しましょう.
(2023年追記) 今風にはarxiv-latex-clearnerなどがよいそうです.情報ありがとうございます.
(以下,2022年以前に書いた説明)まずPerl (*プログラム言語)をダウンロードしてインストールする.たとえばこういうwebページが参考になる.installが終わればperlを起動する.たとえばwindows環境下であれば,プログラムメニューで「perl」と入力すればperl (command line)などが出てくるはず.
処理したいファイル(.tex
)があるフォルダに移動し,latexpand (https://gitlab.com/latexpand/latexpand)からダウンロードした「latexpand」というファイルを入れる.
コマンドラインでも当該フォルダに移動したあと,latexpand (処理したいファイル名).tex > (処理後のファイル名).tex
と入力し実行すれば,コメントを消去したファイルが当該フォルダに出力される.
Microsoft CMTなどで論文を投稿しようとすると,Domain Conflictsを入力せよと指示が出ることがあります.
(他にも様々な理由があるだろうと思いますが) 同じ組織に属する人にレビューなどが回り利益相反を起こさないためのシステムのようです.
基本的には現在の所属のドメイン,つまり所属先のメールアドレスの@マーク以降を入力すれば良いです.
例えば京大の情報科であればi.kyoto-u.ac.jp
と入力します.CMTのInstructionにもありますように,gmailなど組織に関係ない一般のメールプロバイダのドメインを入力することは避けましょう.
なお,少し検索してみるとICCV2013のようにconflict domainの入力について細かく規定している場合があります.投稿先の規定をよく読みましょう.
卒論・修論で,(内容ではなく)表記について毎年同じようなミスが見受けられますので注意点をまとめます. 記法が何種類か考えられる場合,普通は提供されたスタイルファイルやフォーマットに従います.先輩の卒論や修論を見つつ,大学から提供される規定を確認するようにしてください. 日本語の表記ルールについては 日本語表記ルールブック なども参考になります.500円なので一冊買っておくと役に立ちます. 自分自身で判断できそうにない場合は必ずできるだけ早い段階で指導教員に確認するようにしましょう. 以下,注意点です:
\usepackage{mathtools} \mathtoolsset{showonlyrefs}
と入れておけばよいようです.情報ありがとうございます.
.texファイルをarXivサーバー上でコンパイルする必要があります.基本的にpdfファイルを直接アップロードすることはできません.いざコンパイルしようとすると(手元の環境では動くのに)arXivサーバー上ではエラーがたくさん出てきてなかなか進まない…ということが度々あるので,気を付けるべき基礎的なポイントを以下にまとめます.なお,overleafではsubmit機能によりarXivに投稿するため必要なファイルを簡単にダウンロードできるようです.
./figures/a.png
を呼び出すのではなく,./a.png
を呼び出す構造に直しましょう.必然的にtexファイルも修正する必要があります.(追記) zipを介してアップロードする場合はarXivでも普通に階層を利用できるようです(未検証情報).情報ありがとうございます.\bibliography{hoge}
などにより外部のhoge.bib
を呼び出していることが多いかと思いますが,この\bibliograpy[hoge]
を,(overleafでは)以下の手順で取得できるoutput.bbl
の中身に置き換えましょう.
output.bbl
が出てきます.
\bibliograpy[hoge]
を置き換えてください.
natbib
を利用することが多いかと思いますが,経験上,なぜかarXivのnatbibバージョンと干渉することが多いです.手元の環境では適切に引用が表示されているのにarXivサーバーでコンパイルすると(?)
が表示されている場合には,より新しい,または現在の環境で利用しているnatbib.sty
をコピー/ダウンロードしてきて,texファイルと同様にarXivサーバーに直接アップロードするとうまくいくことが多いです.
今後何か追加するかも