自己剽窃はなぜ危険？「自分の論文だから大丈夫」が通用しない理由

投稿ボタンを押した直後、ジャーナルから「Similarity Indexが基準を超えています」という自動メールが届いた——。しかも一致箇所を確認すると、そのほとんどが「自分自身の過去論文」だった。近年、そんな経験をされる研究者が静かに増えています。

類似性チェックツールの精度が上がり、ジャーナル側の運用も厳格化する中で、これまで見過ごされてきた「自分の文章の再利用」が、明確に指摘される時代になってきました。

「自分が書いた論文なのだから、同じ文章を使っても問題ないだろう。」

そう考えてしまう研究者は、決して少数派ではありません。むしろ、真面目に研究を積み重ねてきた方ほど、「自分の言葉を、自分でもう一度使って何が悪いのか」と感じるのはごく自然な感覚だと思います。長年かけて磨き上げた表現、時間をかけて練り上げたIntroductionの一文。それを再び使うことに、罪悪感を持つ方が少ないのはむしろ健全な感覚とも言えるでしょう。

しかし、学術出版の世界では、その常識は必ずしも通用しません。

近年、多くのジャーナルでは投稿原稿に対して “類似性チェック（Similarity Check）” が実施されており、iThenticateなどのツールを用いて、CrossrefのCrosscheckデータベース（数億件規模の既発表論文を収録）と全文照合されます。投稿されたその瞬間に、原稿は世界中の既発表文献と自動比較される。これが、現代の学術出版のスタンダードになりつつあります。

ここで問題になるのは、他者の論文との一致だけではありません。過去に発表した自分自身の論文との一致もまた、「自己剽窃（Self-plagiarism）」あるいは「Text Recycling」として問題視される場合があるのです。

国際的な出版倫理団体COPE（Committee on Publication Ethics）も、text recyclingを「自身の過去の文章を、透明性のある説明や適切な引用なく再利用すること」と定義し、編集者向けのガイドラインを公開しています。つまりこれは、一部の厳しいジャーナルだけの話ではなく、学術界全体のルールとして共有されつつある考え方なのです。研究倫理の観点からも、避けて通れないテーマになってきました。

自己剽窃とは？—「意図」ではなく「見え方」の問題

自己剽窃とは、過去に公表した自分自身の論文、学会抄録、レビュー論文、書籍の章などの文章を、十分な引用や説明なく再利用することを指します。

ここで押さえておきたいのは、「悪意があったかどうか」ではなく、「読者や編集者にどう見えるか」が判断基準になるという点です。研究者本人がどれだけ真摯に取り組んでいても、外形的に既発表論文と重複する記述が並んでいれば、それは自己剽窃として扱われる可能性があります。

もちろん、Methods（方法）の一部のように、どうしても似た表現になりやすい箇所は確かに存在します。同じ細胞株、同じ抗体、同じ統計手法を使えば、書き方が似てくるのはむしろ自然でしょう。実験プロトコルを毎回まったく異なる表現で書くこと自体が、かえって不正確さを生むリスクにもなり得ます。COPEもこの点は理解を示しており、「方法セクションの一部再利用は、適切に開示されれば許容され得る」としています。

問題になるのは、その範囲を超えて、IntroductionやDiscussionの段落単位、あるいは結果の記述そのものをコピーしてしまうケースです。Introductionは研究の背景と意義を語る場であり、Discussionは新しい知見の解釈を提示する場です。ここが過去論文と同一だと、「本当に新しい研究なのか」という疑問が生じます。

Similarity Indexが高い場合には、査読前の段階で編集部から返却（デスクリジェクト）されたり、「重複投稿ではないか」と追加説明を求められたりすることがあります。査読者に回る前の段階で足止めされるため、研究者にとっては非常にもったいない事態です。

許容される類似度の目安はジャーナルにより異なりますが、多くの雑誌では総合的なSimilarity Indexで15〜20%が一つのライン、厳しいところでは10%以下を求める場合もあります。さらに重要なのは、単一の文献との一致が高い場合——たとえば全体では15%でも、特定の1本の過去論文と5%以上重複していれば、それだけで指摘対象になり得るという点です。全体の数字だけを見て安心してはいけない、ということです。

「言い換えれば大丈夫」は、意外と難しい

自己剽窃対策としてよく挙げられるのが、**パラフレーズ（言い換え）**です。

しかし、これが思った以上に難しい作業です。単純な作業に見えて、実は高度な言語運用能力と、研究内容への深い理解の両方が要求される、非常に負荷の高い作業なのです。

単語をいくつか同義語に置き換えただけでは、文章の骨格（構文構造）が同じままなので、類似性検出ツールはこれをほぼ確実に拾い上げます。現代のツールは、単語レベルではなく、フレーズや構文パターンで一致を検出します。一方で、大胆に書き換えすぎると、今度は本来伝えたい科学的な意味やニュアンスが変わってしまう危険があります。数値の丸め、時制、条件節の位置、ひとつの前置詞——そうした細部が結論の解釈を左右することは、実験科学の現場では珍しくありません。

具体例で見てみましょう。

元の文（過去論文）： “The cells were incubated at 37°C for 24 hours in a humidified atmosphere containing 5% CO₂.”

悪いパラフレーズ例： “The cells were cultured at 37°C for 24 h in a humid atmosphere with 5% CO₂.” → 単語置換のみ。構文が同一で、類似性はほとんど下がりません。ツールは容易に一致として検出します。

良いパラフレーズ例： “Following seeding, we maintained the cultures under standard conditions (37°C, 5% CO₂, humidified) for 24 h prior to treatment.” → 語順・構文・視点を変更しつつ、科学的な意味は完全に保持。

この違いを、原稿全体にわたって作り出していく作業は、想像以上に骨が折れます。

特に英語論文では、「意味を維持しながら、自然な英語で、かつ類似性も下げる」という3つの条件を同時に満たす必要があります。ノンネイティブの研究者にとって、この三重の制約を満たすリライトは想像以上に負荷の高い作業です。研究内容そのものを深く理解していないと、適切な書き換えは容易ではありません。単なる英語スキルだけでなく、専門分野の知識、そして学術的な文章作法まで含めた総合力が試されます。

自己剽窃は「意図」がなくても起こる

研究者本人に悪意がなくても、自己剽窃と判断されるケースは珍しくありません。むしろ、日々の研究活動の延長線上で、ごく自然に起こってしまうものです。

たとえば、次のような場面に心当たりはないでしょうか。

過去論文のIntroductionをそのままコピーして、新しい原稿の下敷きにした

Methodsを研究室のテンプレートとして毎回コピー＆ペーストしていた

学会抄録として発表した文章を、そのまま論文の一部に流用した

自身のReview論文で書いた解説文を、Original Articleの背景説明に転用した

博士論文の章を、投稿論文に再構成した際に元の文章を残してしまった

共同研究者と共有した過去原稿から、断片を引き継いだ

これらはいずれも、「不正をしよう」という意図から生まれる行為ではありません。むしろ、効率的に研究を進めようとする真面目な姿勢の表れとも言えます。しかし、Similarity Indexが高くなれば、編集者や査読者から見れば同じ扱いになります。ツールは意図を判定しません。あくまで、文章の一致だけを機械的に検出します。

重要なのは、**「自分の文章だから問題ない」ではなく、「第三者から見て、適切な引用・再構成になっているか」**という視点です。

読者にとっては、その論文が新しい知見を提示しているのかどうかが最も重要です。過去論文と同じ文章が並んでいれば、「本当にこれは新しい研究なのか？」という疑念が生じるのは避けられません。自己剽窃が問題視されるのは、盗用の是非というより、「学術的な新規性への信頼」を損なうからなのです。学術コミュニティ全体の信頼を守るための、共通ルールと言えます。

投稿前にできる、最も確実な対策

自己剽窃は、投稿後に指摘されてから対応するよりも、投稿前に類似性を確認・改善しておく方が圧倒的に効率的です。指摘されてからのリカバリーは、単なる修正では済まず、編集部との説明のやりとり、共著者への説明、リサブミット時期の遅れといった、研究者本人にとって最も避けたい負担を伴います。場合によっては、著者としての信頼にも影響しかねません。

投稿前に確認しておきたいポイントは、次のようなものです。

iThenticate等のツールで、投稿前にSimilarity Indexを把握しているか

単一文献との一致率が突出していないか（全体%だけでなく内訳を見る）

Methodsの再利用について、必要に応じて出典を明記しているか

IntroductionとDiscussionは、今回の研究の文脈に合わせて書き直されているか

学会抄録・プレプリントから流用した箇所を、そのままにしていないか

図表のキャプションが過去論文と重複していないか

NAIでは、iThenticateによるSimilarity Indexの確認だけでなく、専門エディターが**意味を損なわないように英文をリライトし、類似性の低減を目指す「類似性削減校閲」**を提供しています。研究分野に精通したエディターが、科学的な内容を正確に理解した上で、構文レベルからのリライトを行います。

ご希望のSimilarity Indexを目標として複数回の調整を行うため、「自分で言い換えたけれど、十分下がるか不安」「自己剽窃を避けながら、自然で読みやすい英文にしたい」という研究者の方に多くご利用いただいています。単なる数字合わせではなく、読みやすさと学術的正確性を両立させることを目指しています。

自分の研究を、自分の言葉で、しかし新しい形で読者に届ける——。そのための一歩として、投稿前の類似性チェックを、ぜひ習慣にしていただければと思います。研究者の皆様が、安心して次の投稿に臨めるよう、私たちも全力でサポートしてまいります。

詳しくは、NAIの類似性削減校閲サービスをご覧ください。