SHOUJIKE

象牙の塔の中の隠れた戦い: AI は大学に紙の規則の再構築を強制しているのか?

2月8日のニュース:DeepSeekの爆発的な人気は、AIの驚異的なパワーで再び人々を驚かせています。大規模モデルによってもたらされたAI能力の飛躍的進歩は、多くの業界に大きな影響を与えています。

復旦大学は以前、「復旦大学学部卒業論文(設計)におけるAIツールの使用に関する規則(試行実施)」を発行し、初めて禁止されるAIツールの範囲を明確に列挙し、「AIを使用して学部論文を書く」ことを正式に禁止しました。

実際、大規模言語モデルの機能が継続的に向上するにつれ、生成 AI は文章や絵画などの分野で飛躍的な進歩を遂げてきましたが、AI 生成コンテンツの誤用のリスクも生じています。

多くの学生が論文作成にAIツールを利用しています。この行為は、剽窃のリスクや学術的評判の毀損につながるだけでなく、学生がAI生成コンテンツに過度に依存し、自立的かつ批判的に考える能力を弱めることにもつながりかねません。さらに、AI生成論文は革新性と深みに欠けることが多く、このような「学術的ゴミ」の査読に教育資源が浪費されています。

「AIツール」に注力する大学が増えるなか、AI技術の発展と人材育成をいかに両立させるかが重要かつ喫緊の課題となっている。

人間からAIへ:ゴーストライター業界の再編

「ゴーストライター」という現象は古代から存在していました。『新説世界物語』の時代には「ゴーストライター」(他人に代わって文章を書く人)が存在していました。しかし、現代ではゴーストライターは「人間」から「AI」へと進化しています。

ゴーストライターに執筆を依頼する場合、創作プロセスはゴーストライターの専門知識、個人的な経験、そしてライティングスタイルによって制限されることがよくあります。しかし、技術の継続的な進歩により、大型模型は今や「万能」なものとなっています。

これらの大規模AIモデルは、より幅広く深い専門知識を有し、様々な分野のライティングニーズに容易に対応できるだけでなく、圧倒的な出力効率を誇ります。短期間で大量の高品質コンテンツを生成することで、クリエイティブな効率を大幅に向上させます。これらの大規模AIモデルの登場は、ライティング分野に革命的な変化をもたらしたことは間違いありません。

ゴーストライターの世界は、このテクノロジーの波の中ですでに大きな再編を経験しており、伝統的なゴーストライターのモデルは徐々に置き換えられ、新しいモデルが登場しています。

Bilibili、Xiaohongshu、Douyinなどのプラットフォームで「AI生成エッセイ」や「AIライティング」といったキーワードを検索すると、豊富な関連コンテンツが見つかります。AIツールを使って完璧な論文を書く方法を解説する動画チュートリアルや、AIライティングツールを販売する多数のショップがあり、収益性の高いエコシステムが形成されています。

BilibiliのAI搭載学術ライティングチュートリアルビデオは200万回以上の視聴回数を獲得しました。


Xiaohongshu のユーザーが、AI を使用してコースの論文を迅速に完成させた方法を共有したところ、その投稿は 2,000 件を超えるいいねと保存を獲得しました。

タオバオには、年間5万部以上を売り上げるAIライティングソフトウェアがあります。四半期ごとのカードの平均価格を21.8元とすると、年間売上高は100万元を超えます。

湖北理工大学で環境工学を専攻する張さんは、自分とクラスメートは論文執筆にAIツールを活用していると語った。インターネットで検索すれば関連するAIツールを簡単に見つけることができ、論文執筆に確かに役立っているという。

山西師範大学で観光管理学を専攻する李さんは、「AIは本当に素晴らしいものです」と率直に語りました。彼は、AIを活用して論文を執筆する際に、複数のAIツールを活用し、AIが生成したコンテンツを編集していると説明しました。李さんにとって、AIツールは経営学関連の論文作成において非常に効果的であり、多くのクラスメートも活用しています。

偶然にも、湖南師範大学で数学を専攻する大学院生の江さんも、論文の執筆にAIを活用していると語った。

学校や教師が生徒のAIツールの使用を支持しているかどうかを尋ねたところ、2人が「どちらともいえない」、1人が「強く支持する」と回答しました。(選択肢:a)強く支持、b)どちらともいえない、c)反対)

私たちは、中国でよく知られている AIGC ツールをいくつか無作為に選び、「卒業論文を完成させるのを手伝ってもらえますか?」と直接尋ねました。どのツールからも「論文全体を完成させるのを直接手伝うことはできません」という否定的な回答が返ってきました。

しかし、プロンプトを調整することで、制限を回避することが容易になります。例えば、エッセイを書くという要件を「模範エッセイ」を書くように変更すると、前述のツールの1つは数分以内に約8,000語のエッセイを直接提供できるようになります。

電子商取引プラットフォームで販売される AI 搭載論文執筆ツールは、AI 搭載論文執筆エージェントとして設計されているため、AI 搭載論文執筆をより簡単に使用でき、一括作成できます。

AIツールを用いて論文を生成する現象について、天津理工大学の羅珣教授は次のように指摘した。「現在の生成型人工知能技術は、本質的に大量の既存データの変換に基づいているため、独創性が不十分になる可能性がある。さらに、一部の生成型人工知能ツールは、テキストの事実検証が困難な場合でも、形式的に完全なテキストを提供してしまうため、論文の信頼性に影響を与えている。」

IEEEメタバース標準委員会事務局長兼IEEEメタバース標準ワーキンググループ議長の馬新祥氏は、次のように述べています。「高等教育の目的は、選抜された優秀な人材が関連する専門知識を習得し、複雑な課題を比較的自立して完了できるようにすることです。論文は、このプロセスにおいて複雑な課題の完了を検証する一つの方法です。AIを用いて学術論文を生成することは、この検証方法を完全に無効にし、優秀な人材を選抜する能力を失わせることになります。第二に、現在のアルゴリズム、計算能力、データには限界があるため、AIは一見もっともらしく見えても、最終的には意味をなさないコンテンツを生成する可能性もあります。AI生成論文の真正性は保証できず、深刻な誤解を招く可能性があります。もちろん、現代においてAIの活用能力も非常に重要であり、優秀な人材を評価する上で重要な要素の一つです。したがって、論文の枠組み生成や情報検索といった、論文作成を支援するためのAIの利用は問題ではありません。私たちが対処すべきは、論文作成のためのAIの利用です。」

鍵となるのは、AI関連論文の禁止をいかに効果的に実施するかだ。

実際、学術界において「AI生成論文」をどのように定義するかについて明確な定義は今のところ存在せず、論文がAI生成論文であるかどうかを判断する統一基準も存在しません。一部の大学・機関では、AI生成コンテンツ比率(AI率)が30%を超えてはならないと規定していますが、より厳格な大学・機関では、修士論文や博士論文のAI率基準を10%や5%に設定している場合もあります。

復旦大学の「学部卒業論文(設計)におけるAIツールの使用に関する規則(試行)」を例に挙げると、文面上の禁止事項には、AIツールを直接使用して本文、謝辞、その他の構成要素を生成すること、言語の洗練や翻訳を行うことなどが含まれています。この規定はまだ比較的一般的なものです。

天津理工大学の羅珣教授は、「AI生成学術論文」への対応における最大の課題は検出にあると指摘した。これには2つの重要な指標が含まれる。第一に、テキストの重複率(他者の剽窃と自己剽窃、つまり同一内容の複数の出版)は、生成AIツールの進歩によって低下するだろう。第二に、事実の正確性は、その検証に多大な人的労力を要する。これを達成するには、インテリジェントな検出方法の改善だけでなく、自己規制と説明責任のルールの精緻化も必要となる。

現在、学術界では、論文が AI によって生成されたかどうかを判断する際、主に論文の内容特性、執筆スタイル、専用の検出ツールを使用した分析が用いられています。

検出ツールの観点から、実際の運用において記事/論文が AI によって生成されたかどうかを判断することはどの程度難しいのでしょうか。また、この判断はどの程度正確でしょうか。

国内のAI偽造防止サービスプロバイダーであるRealAIのアルゴリズムサイエンティスト、陳鵬氏は、AI生成テキストの識別における主な技術的課題は、現実世界のアプリケーションにおいて、人間とAIがテキストを共同で作成する可能性がある点にあると説明した。例えば、人間が大まかに文章を書き、AIがそれを推敲したり、続きを書いたりする、あるいは人間がAIが生成したコンテンツを修正したりするといったケースがある。こうした人間とAIのハイブリッドな共同執筆スタイルは、識別の難易度を高める。

大規模モデル技術は急速に進化しており、最先端の AI ツールは現在、人間の言語スタイルや論理的推論を模倣し、引用まで取り入れた非常に高品質のテキストを生成しているため、表面的な特徴に基づいて AI によって生成されたものかどうかを直接判断することは困難です。

人間の表現能力には大きなばらつきがあることも重要です。同じ専攻の学生であっても、流暢な言語と厳密な論理で質の高い文章を書くことができる人がいる一方で、文法上の誤り、論理の矛盾、曖昧な表現など、質の低い文章を書く人もいます。人間の文章におけるこうした多様性も、認証を困難にしています。

陳鵬氏は、AI生成のテキスト識別ツールの精度は、検出されるテキストの種類(ニュースレポート、オンラインコメント、ソーシャルメディアの投稿など)と複雑さ(言語スタイル、構造、単語の選択、長さなど)によって決まると明らかにした。

一方、陳鵬氏は、AI生成の学術論文は一般的に自由記述よりも検出しやすいと強調しました。これは、学術論文が固定された形式と構造を持ち、タイトル、要旨、序論、方法論、結果、考察、結論といったセクションを含む厳格な執筆基準に従っているためです。検出ツールはこれらの明確な基準点を活用して、より効果的な検出手法を設計することができます。

Ruilai Smart社の製品であるDeepRealを例に挙げると、検出対象となるテキストが100文字を超える場合、フリーテキストの平均精度は約90%、特定の種類のテキストの精度は95%を超えます。

これは、DeepReal などの技術ツールを使用すると検出効率が大幅に向上することを意味しますが、技術ツールだけに頼ると 100% 正確な識別率を達成することはできません。

陳鵬氏は、生徒の文章が「機械的」なスタイルであるか、文構造が単純であるか、適切な引用が使われているか、長いが表現に深みが欠けているか、そして長い文章が論理的に一貫しているかを教師が観察することで、論文がAIによって生成されたものかどうかをさらに判断できると提案した。

馬欣氏によると、大学におけるAI禁止措置の最大の課題は、AIが利用されたかどうかを検知することだ。実施不可能な禁止措置、あるいは低コストで実施できる禁止措置は意味をなさない。現在、政府と学界は共にAIのコンテンツラベリングを推進している。この義務化を実現することでのみ、大学はAI利用の痕跡をより容易に検知し、AI禁止措置を効果的に実施することができる。

IEEEデジタル金融・経済標準委員会の委員長である林道荘氏は、AI生成論文の問題よりも、学部論文の質の方がより重視されるべきだと強調した。彼は、「AI生成類似度」などの指標を定量化するための統一された方法と標準の確立を強く望んでいると述べ、ますます厳格化が進む規制プロセスにおいては、スピードよりも公平性と合理性がはるかに重要であると述べた。

専門家の意見

学部生の卒業論文は、知識とスキルの総合的な応用力を評価し、自立した思考力と問題解決能力を涵養し、研究方法と基準を習得し、才能を披露し、学術交流と連携を深める役割を果たします。しかし、テクノロジーの継続的な発展を踏まえ、AI時代において学生の能力評価方法の改革が必要かどうかも検討する必要があります。

馬欣氏は、ほとんどの学部論文は学術的な意義を欠いていると考えている。その真の価値は、卒業生が比較的複雑な課題を体系的に遂行できることを示すことにある。この意義と価値はかけがえのないものだ。AI時代、いや、どの時代においても、学生の能力を評価するための方法と基準はより多様化されるべきである。AI時代においては、AIを用いて複雑な課題を遂行する能力が極めて重要であり、単純な課題と複雑な課題を遂行する能力を区別する重要な基準となる可能性がある。大学がこうした評価を実現するための適切なコースや課題を開発することが期待される。

清華大学コンピュータサイエンス学部ヒューマン・コンピュータ・インタラクション・メディア統合研究所の研究エンジニアであり、IEEEデジタル金融・経済標準委員会の事務局長、中国通信研究院ブロックチェーン委員会の委員でもある丁慧氏は、次のように述べています。「AI時代において、大学は時代の変化に合わせた学生育成が必要です。AIツールの機会と課題は、あらゆる分野に存在します。この時代の学部生は、将来の就職市場で競争力を維持するために、AI能力を身につける必要があります。大学が重点的に取り組まなければならない重要な目標は、学生のAI学習能力、AI活用能力、そして新しいAIツール開発能力を育成し、AI技術と応用能力を様々な専攻の教育や学生の能力評価に統合することです。」