小保方さんの論文コピペ事件やオリンピックロゴのパクリ事件と、世界的な著作権問題に事欠かかない日本ですが。
そこでふと思ったのは、「研究論文のコピペチェックって、大学関係者や研究機関ってどうやってるんだろう?」と。
調べて見ると、株式会社アンクさんで「コピペルナー」というコピペ判定支援ソフトを出しているらしい。
【リンク】コピペルナー
このコピペルナーというソフト、買い切りで安い物は25,380円~エクセルやワードファイルに対応したV3バージョンだと46,980円。ビジネスユーザーだと69,120円って・・・
なんでこんなに高いの!?
私らウェブメディア業界では「コピペリン」というコピペ判定ソフトをよく使っていますが、こっちは年間ライセンスだけど1年間6,480円で、バージョンアップも無償ですよ。
【リンク】コピペチェックソフト コピペリン
なぜウェブメディア業界でコピペ判定が必要か
どうしてウェブメディア業界でコピペ判定ソフトを使っているか。
それは、外注でライターさんを雇っていると、納品してくる記事が他のウェブサイトから一部コピペしたものや酷いものだと全文コピペしてくる人がいるからです。
納品された記事をコピペ判定して「この記事はオリジナルの文章だな」と分かった記事を編集入れてウェブメディアに使います。
みんなオリジナル記事を書いて納品してくれば良いのですが、どうしてもたまにやってくるコピペライターさん。
そういう人の記事をコピペリンでチェックすると、
コピペした文節はご覧の通り真っ赤になって表示されます。
ソフトが文節ごとに自動で区切ってくれて他のネット上のコンテンツからコピペしてないかチェックしてくれるんです。
コピペ元ウェブサイトのURLもはじき出してくれるから、「あなた、このサイトからコピペしたでしょ。書き直し!」と天誅を下せるわけです。
私はこういうライターさんは即刻クビにしてますけどね。
コピペリンで論文のコピペ検出は有効かやってみた
ということで、論文のコピペ検出にもコピペリンが有効なのか実際にやってみることにしました。
先ほどご紹介した高額なコピペ判定ソフト「コピペルナー」と私らが使っている「コピペリン」の仕様を比較してみると、機能上はほとんど同じなんですよね。
違いを挙げるとコピペリンはコピペルナーと比べてpdfとパワーポイントファイルが読み込めないんですが、これはワード文書にコピペして判定すればOKでしょう。
コピペリンで読み込めるファイル形式は、 txt、csv、xlsx、xlsm、docx、docm、pptx、pptm、html、htmの10種類。
画面上にファイルをドラッグ&ドロップして「検索開始ボタン」をクリックするだけ。細かい設定もいろいろできますが、基本的には弄る必要ありません。
PubMed-NCBIからのコピペ判定
【出典】http://www.ncbi.nlm.nih.gov/pmc/articles/PMC4177642/
ということで、まず世界的に有名なPubMed-NCBIから英字論文をコピペしてコピペリンに判定してもらいました。
今回はNCBIから読めるフリーテキスト論文をまるっとコピペしたワード文書を作って、コピペリンに読み込ませてみると、
真っ赤ですね。
ちゃんとコピペ元のNCBIの論文リンクもはじき出してくれていました。
英字論文のコピペ判定は問題無いようです。
CiNiiからコピペ判定
【出典】CiNii Articles
お次は日本語論文検索サイト「CiNii」に掲載されている論文からコピペ。
コピペ元論文はウェブサイトにあるpdf形式のものから一部だけコピペして試験させて頂きました。
【試験コピペ元】バスキュラーアクセス肢に発症した鎖骨下静脈閉塞の 1 例
CiNiiはJ-Stage掲載の論文にリンクしているようですが、ちゃんとJ-Stageの論文からコピペした判定が出ていますね。
日本語論文検索サイトでも大丈夫そうです。
まとめ
ということで、コピペルナーよりも遥かに値段が安いコピペリンでも、十分に論文コピペ検出が出来るようです。
どちらのソフトもプログラムの機能上は大差ないでしょう。文節を区切ってウェブに同じ文章無いか拾ってくるだけですから。
1年6,480円で使い放題なので、私の仕事で重宝しております。
一応、無料のコピペチェックサイトとして剽窃チェッカーというものもありますが、こっちは2000文字までしか読み込めないし、細かい設定も出来ないので、こちらは簡易的に使いたい人向けですね。
それ以前に、コピペ&パクリは許すまじですけどね!
ダメよね、楽して成果出そうとしちゃ。