AI生成された質問応答の改訂版（一）：CoTと材料選択

私は以前、Anki カードを作成するためのプロンプトを GPT-4 で生成しました。これは Auto Prompt からインスパイアを受けたもので、AI が出力結果の品質を評価した後に自らのプロンプトを調整し、最適化を図ることを目的としています。Claude と GPT-4 で以下のプロンプトを実験しました：

抽認カードを作成する際には、SuperMemo の 20 のルール、AP 試験やその他の試験の問題、さまざまなチュートリアルのガイドラインを十分に参考にしてください。また、以下の要件に従ってください：

抽認カードは簡潔で明確であり、重要な情報に集中してください。
質問は具体的で明確であり、曖昧さを避けてください。
簡単で直接的な言葉を使用し、カードが読みやすく理解しやすいことを確保してください。
答えは 1 つの重要な事実 / 名前 / 概念 / 用語のみを含むべきです。
質問の適用性と普遍性を考慮し、異なるシーンや知識領域で実際に役立つ価値を持つことを確認してください。
質問の妥当性に注意し、誤解や疑問を引き起こさないようにしてください。

以下は SuperMemo の 20 のルールの概要です：

理解できない場合は学ばないこと。
学習材料は質問と答えの形式に基づくべきです。
最小情報原則：各質問は可能な限り簡潔であるべきです。
ブール質問（はい / いいえの質問）を避けること。
質問の表現を最適化すること。
抽象的ではなく具体的な質問を使用すること。
純粋な理論知識ではなく、応用的な知識に焦点を当てること。
質問の難易度を均衡させ、あまりにも簡単または複雑な質問を避けること。
多様な質問形式を使用し、学習の興味を高めること。
答えが思い出しやすく理解しやすいことを確認すること。
文脈の手がかりを使って思い出すのを助けること。
質問を作成する際に多様な学習の視点を考慮すること。
知識を独立した、把握しやすい部分に分解すること。
適切な時に画像、図表、その他の視覚的補助ツールを利用すること。
適切な復習計画を策定し、長期記憶を確保すること。
間隔反復法を使用し、記憶効果を高めること。
混同しやすい知識点に特化した質問を作成すること。
異なる分野の知識を統合し、より高いレベルの理解を形成すること。
定期的に抽認カードを更新・修正し、知識の正確性と最新性を確保すること。
自分の学習プロセスにフィードバックと調整を行い、学習効果を高めること。

テキスト：太陽は太陽系で唯一の恒星であり、水素とヘリウムで構成されています。太陽の中心温度は約 1500 万度です。このような高温下で、水素の原子核は核融合反応を起こし、ヘリウム原子を形成し、大量のエネルギーを放出します。

SuperMemo の 20 のルールに基づいて、テキストから情報を抽出し、以下の抽認カードを作成できます：

質問	答え
太陽系で唯一の恒星は何ですか？	太陽。
太陽は主にどの 2 種類の気体で構成されていますか？	水素とヘリウム。
太陽の中心温度は約何度ですか？	1500 万度。
太陽の高温の中心で、水素の原子核は何の反応を起こしますか？	核融合反応。
核融合反応で、水素の原子核は何の元素を形成しますか？	ヘリウム元素。
太陽の核融合反応はどのようなエネルギーを放出しますか？	大量のエネルギー。

テキスト：地球の自転一周の時間は 23 時間 56 分 4 秒であり、この時間は恒星日と呼ばれます。地球が太陽の周りを一周する時間は約 365.24 日であり、回帰年と呼ばれます。
SuperMemo の 20 のルールに基づいて抽認カードを作成します：

質問	答え
地球の自転一周の時間は何と呼ばれますか？	恒星日。
恒星日の長さはどれくらいですか？	23 時間 56 分 4 秒。
地球が太陽の周りを一周する時間は何と呼ばれますか？	回帰年。
回帰年の長さは約何日ですか？	365.24 日。

このセットの抽認カードは以下のルールに従っています：

ルール 2：学習材料は質問と答えの形式に基づいています。
ルール 3：最小情報原則、質問は可能な限り簡潔です。
ルール 5：質問の表現を最適化し、質問を明確で理解しやすくします。
ルール 10：答えが思い出しやすく理解しやすいことを確認します。
ルール 13：知識を独立した、把握しやすい部分に分解します。

これらの抽認カードを通じて、SuperMemo の 20 のルールが実際の制作プロセスにどのように適用されるかを見ることができます。もちろん、テキストの内容や学習目標によっては、他のルールを採用する必要があるかもしれません。重要なのは、抽認カードを作成する際にこれらのルールを総合的に考慮し、学習効果を高めることです。

抽認カードを作成する際には、以下の点に注意してください：

異なる知識領域や背景に応じて、SuperMemo の 20 のルールを柔軟に活用してください。
実際のニーズに応じて、AP 試験やその他の試験の問題、さまざまなチュートリアルのガイドラインを参考にしてください。
質問の適用性と普遍性に注意し、異なるシーンや知識領域で実際に役立つ価値を持つことを確認してください。
質問の妥当性を保ち、誤解や疑問を引き起こさないようにしてください。

以上の要点を総合的に考慮することで、より効果的に抽認カードを作成し、学習効果を高めることができます。以下は提供するテキストです：
。。。。。。。。

例を挙げる#

Claude と GPT-4 で、詳細な問題を説明するために大量の例を挙げるテキストを生成する際に、約 8 割の問答がテキストから独立して存在できず、手動で修正する必要があるという現象が見られました。

詳細事実の分解と原子化#

GPT-4 は独立した質問をうまく提起できますが、答えが複数のステップや要点に関わる場合、要点やステップを分解して記憶しやすいカードを形成することを無視し、列挙の悪夢に陥りやすいです。彼が理解する事実は、問題から出発するものであり、答えではありません。

Claude は一部中英混合の現象が見られるだけでなく、連鎖的な質問の現象も発生し、1 つの問答の下に 3 つの母問題に関連する子問題が必要になることがあります。例えば、「これは何を反映していますか？」、「公式間の一貫性を反映しています」。

latex 公式の保持#

latex 公式は quicker の好未来 OCR を使用して無料で認識され、少なくとも mathpix の有料問題を考慮する必要はありません。まずテキスト OCR を完了し、その後公式部分を一つ一つ認識します。

学習材料の選択#

良い入門教材は初心者が早く手をつけられるようにします。例えば、復旦大学が出した『高等代数学』のように。
テキストの表現が簡潔で論理的であればあるほど、生成される問答は良くなりますが、欠点は文法的に主語や目的語などを尋ねる能力が低く、異なる形式で同じ論理と思想の質問に変換する能力が乏しいことです。入力されたテキストの書き方が一貫している必要があります。そうでないと、Waluigi 効果が増加しやすいです。

長さの問題#

詳細な内容の陳述は、生成される問答が比較的詳細であることが多く、テキストの長さや対話の長さが増加するにつれて、Waluigi 効果が増加します。

モデルの問題#

Claude は一部中英混合の現象が見られますが、一貫性は強く、フィードバックと調整が不十分で、質問の冗長性は良好に保たれています。
GPT-4 はあまりにも一般的な質問を生成しやすいですが、背景を提供する能力は Claude よりも強く、フィードバックと調整能力が高いです。質問が少なく、冗長性が低いです。

プロンプトの問題#

プロンプトを書く際には、パターンと特殊性に注意し、何をするかに集中し、何をしないかに焦点を当てないようにします。

Claude と GPT-4 は辞書テキストに対して「例を挙げてください」という質問を生成しやすいですが（数量も少ない）、これは辞書テキストに最適化された質問がないためです。また、fine understanding の問題もあり、深い文学的問題で勝ることを保証できません。簡単に言えば、古代の「小学」の言語細分化の学問に基づいています。モデルの確率問題に基づき、元のトレーニングデータに高頻度の言語や分野知識が含まれている場合、高品質で正確な内容を生成しますが、誤りや曖昧な用法の確率は依然として存在します。彼らは自動的に誤りや曖昧さに合致するように修正しますが、見かけ上正しい用法に見える場合もあります。

私は以前、辞書や文字の説明生成問題に関するプロンプトを書いたことがあり、上記のプロンプトとは大きく異なります。例えば：

言語学習における文のマイナーは、文法書や辞書を使用してフラッシュカード（主に Q&A 形式）を作成する人々のことです。
例えば、テキスト：welcome2 ●●● S2 W3 形容詞
1 あなたは歓迎されます SPOKEN 誰かが何かに感謝したときに返事をする礼儀正しい方法
‘コーヒーをありがとう。’ ‘どういたしまして。’
2 誰かが場所に歓迎されている場合、他の人々はその人がそこにいることを喜んでいます
私は本当に歓迎されていないと感じました。
クラブでは歓迎されていないと感じました。
メアリーは私たちをとても歓迎してくれました。
私たちは新入生が歓迎されるように努めています。
3 何かが歓迎される場合、それを楽しむことができるのは、それが必要だと感じるからです
週末は仕事のプレッシャーからの歓迎される休息でした。
スコットランドでの 6 ヶ月はロンドンからの歓迎される変化になるでしょう。
一杯の紅茶は非常に歓迎されます。
4 何かが歓迎される場合、それが起こったことを喜んでいるということです
金利の上昇は投資家にとって歓迎されるニュースです。
この新しい資金は業界にとって歓迎される後押しとなるでしょう。
5 何かを歓迎される SPOKEN 誰かがそれを望む場合、彼らはそれを持つことができると言うために使用されます、なぜならあなたは確かにそれを望んでいないからです
もしその仕事を取りたいのであれば、あなたはそれを歓迎されます！
6 何かをすることを歓迎される SPOKEN 誰かがしたい場合に何かをするように招待するために使用されます
あなたは昼食のために滞在することを歓迎されます。

Q&A: Q: 誰かが「どういたしまして」と返事する方法は？ (SPOKEN)
A: 「どういたしまして」は、誰かが何かに感謝したときに返事をする礼儀正しい方法です。
Q: どのような状況で誰かが歓迎されていないと感じることがありますか？
A: 誰かが場所に歓迎されていない場合、それは他の人々がその人がそこにいることを喜んでいないことを意味します。
Q: 「メアリーは私たちをとても歓迎してくれました」の「歓迎」の意味は何ですか？
A: 誰かが場所に歓迎されている場合、他の人々はその人がそこにいることを喜んでいます。つまり、メアリーは他の人々が私たちがそこにいることを喜んでいるということです。
Q: 「週末は仕事のプレッシャーからの歓迎される休息でした」の「歓迎」の意味は何ですか？
A: 何かが歓迎される場合、それを楽しむことができるのは、それが必要だと感じるからです。つまり、その休息は私が必要としているということです。
Q: いつ誰かが何かを歓迎されると感じることがありますか？
A: 何かが歓迎される場合、それはあなたがそれを必要だと感じるから楽しむことができるということです。
Q: 「金利の上昇は投資家にとって歓迎されるニュースです」の「歓迎」の意味は何ですか？
A: 何かが歓迎される場合、それが起こったことを喜んでいるということです。つまり、金利の上昇が起こったということです。
Q: 誰かが「どういたしまして」を使って誰かを何かをするように招待する方法は？
A: 「あなたは昼食のために滞在することを歓迎されます」。
Q: 「何かを歓迎される」の意味は何ですか？(SPOKEN)
A: それは、誰かがそれを望む場合、彼らはそれを持つことができると言うために使用されます。なぜなら、あなたは確かにそれを望んでいないからです。
Q: 「何かを歓迎される」の意味は「もしその仕事を取りたいのであれば、あなたはそれを歓迎されます！」の中で何ですか？
A: それは、私がその仕事を取ることができることを意味します。なぜなら、話者は確かにそれを望んでいないからです。
Q: 「何かをすることを歓迎される」の意味は何ですか？(SPOKEN)
A: 誰かがしたい場合に何かをするように招待するために使用されます。
Q: 「何かをすることを歓迎される」の意味は「あなたは昼食のために滞在することを歓迎されます」の中で何ですか？
A: それは、リスナーに昼食のために滞在するように招待するために使用されます。

私はテキストを提供して Q&A 形式を生成します。

論理学の思想（CoT）#

AI を使用して問答を形成する際のもう一つの欠陥は、彼らがしばしば文中の単一の文法部分に質問をすることですが、問答題を形成する際には「xxx と xxx の関係は何ですか？」や「yyy は xxx と xxx の関係ですか？」だけではなく、具体的な帰納、比較、テキストの論理的思考が必要です（流暢で論理的な言語を使用することは、知識と文言のテンプレートを構築するのに役立ちます。簡略化された表現は時にはあまり厳密ではなく、テンプレートはさらに分解できます。たとえば、数学やコンピュータの思想は常に細分化され、複雑な問題を記憶する際には異なる原子知識モジュールや原子的方法ステップを動員することを学び続けます）。

感想：#

是非問題を避ける：もし問答が正誤を判断するだけで、理由を示さない場合、学習者は混乱し、不満を感じやすいです。
背景と引用：問答をテキストからより独立させるためには、明確な背景と引用を提供し、学習者がこれはどの学問分野の知識であるかを理解できるようにする必要があります。たとえば、数学における関数はマッピング関係であり、コンピュータ科学においては方法の別名です。情報源を紹介するために文献引用のような方法を使用し、後で確認や修正ができるようにします。
質問の多様性と冗長性：学習者が詳細についてより深く理解できるように、異なる角度からの質問を提起し、彼らの能動的な思い出しと考える能力を刺激する必要があります。したがって、質の高い複数の質問を生成するように努めます。これらの質問は異なる角度からテーマに切り込み、異なるレベルでの理解を検討します。たとえば、ある概念についてその定義、機能、特性などを同時に尋ねることができます。
プロンプトとカードは常に修正が必要であり、この記事では異なるバージョンのプロンプトとその効果を記録します。

正如：

テキストに基づいてフラッシュカードを生成します。（仮）
フラッシュカードは強力な学習ツールです。また、作成するのは面倒です。
一部の読者は、学習している科目のフラッシュカードを生成するために ChatGPT を使用していると言いました。これは「言葉の計算機」としての LLM の能力の範囲内のようです。したがって、正しいプロンプトを使用すれば、ここでかなり良い結果を得ることができます。提供された材料をフラッシュカードに変換することを期待するのではなく、見たい材料を入力することが重要です（以下を参照）。
ただし、「良い」フラッシュカードを作成することの難しさを考慮すると、最初にレビューする前に Anki に入力することはお勧めしません。それでも、フラッシュカードを作成するのは面倒なので、後でレビューする初稿を得ることでプロセスを大幅に加速できるかもしれません。カードの正確性を確認する前にデッキに入れる場合、リスクは比較的限られています。——Scott.H.Young