GPT-4oに考えさせられる
1年ちょっと前ですが、ChatGPTが話題になり始めたころに、ChatGPTを使って英語学習アプリを作ってみた、というブログを書きました。
ELSPINA VEINZ TECH BLOG - ChatGPTと話す、ChatGPTで考える
この1年で、各方面で生成AIサービスの評価が進んできたと思います。それらの多くは、基本的に「AIを、どう利活用するか」という視点に基づくものだったように見えます。上のブログでも少し書いたように、この技術が何に使えるのか、模索されていた1年だったと思います。
ところで、先日公開されたGPT-4oを試していたら、「これはもはや、何に使えるのか考えるという対象ではないのかも…」と思うに至ったので、このことを記事にしてみます。
サンプル
サンプル1: gpt-3.5でも回答できていた質問
質問
(イマヌエル・カントと、彼のケーニヒスベルクにおける逸話について教えてほしい)
回答(gpt-3.5-turbo)
Immanuel Kant was a renowned German philosopher who lived from 1724 to 1804. He spent the majority of his life in the city of Königsberg (now Kaliningrad, Russia), where he was born, raised, and worked as a professor at the Un41;2500;0civersity of Königsberg.
Kant's time in Königsberg was marked by his prolific academic career and influential philosophical writings. He is best known for his works on metaphysics, epistemology, ethics, and aesthetics, including his groundbreaking works "Critique of Pure Reason," "Groundwork of the Metaphysics of Morals," and "Critique of Judgment."
During his time in Königsberg, Kant also developed a reputation as a prominent figure in the intellectual and cultural life of the city. He was known for his rigorous work ethic, dedication to his students, and commitment to advancing philosophical inquiry.
Overall, Kant's episode in Königsberg was a significant period in his life and career, during which he produced some of his most important and enduring contributions to philosophy.
回答(gpt-4o)
Certainly! Immanuel Kant (1724-1804) was a highly influential German philosopher known for his work in epistemology, ethics, and metaphysics. He spent most of his life in Königsberg, a city in East Prussia (now Kaliningrad, Russia), where he was born, educated, and eventually became a professor at the University of Königsberg.
### Key Aspects of Kant's Life and Work in Königsberg:
1. **Early Life and Education**:
- Kant was born in Königsberg and attended the Collegium Fridericianum, a rigorous Pietist school.
- He later enrolled at the University of Königsberg (Albertina) in 1740, where he studied philosophy, mathematics, and the natural sciences.
2. **Academic Career**:
- After completing his studies, Kant worked as a private tutor for several years before returning to the University of Königsberg.
- He became a lecturer and later a full professor of logic and metaphysics in 1770.
3. **Philosophical Contributions**:
- Kant is best known for his "Critiques," particularly the "Critique of Pure Reason" (1781), where he explored the limits and scope of human understanding.
- His other major works include the "Critique of Practical Reason" (1788) and the "Critique of Judgment" (1790).
- Kant's philosophy is often summarized by his famous dictum: "Sapere aude" (Dare to know), emphasizing the importance of reason and autonomy.
4. **Königsberg Routine**:
- Kant was known for his highly disciplined and predictable daily routine. He would take regular walks at the same time each day, to the extent that locals reportedly set their clocks by his schedule.
- Despite his routine, Kant was deeply engaged with the intellectual community, corresponding with other scholars and staying informed about the latest developments in various fields.
5. **Legacy**:
- Kant's influence extends across numerous disciplines, including philosophy, political theory, and theology.
- His ideas about the categorical imperative and the nature of human perception continue to be studied and debated.
Kant's life in Königsberg was marked by a commitment to intellectual rigor and an unwavering dedication to his academic and philosophical pursuits. His work laid the foundation for many modern philosophical discussions and continues to be a cornerstone of Western philosophy.
gpt-3.5-turboでも回答できていますが、gpt-4oでは何も指示しなくても、回答が構造化(Markdownify)されています。
サンプル2: 画像認識
正確に、いつから可能になったのか追いかけていないのですが、gpt-4oでは通常のChat APIに画像を渡して、内容について質問できるようになっているようです。
質問
(画像は、ある交差点である。どのくらい混雑しているのか知りたい。10点満点のスケールで表現してほしい。SCORE=Nという表現で始まる回答を期待している)
回答(gpt-4o)
SCORE=3
The intersection appears to have a moderate number of pedestrians and a few vehicles, indicating light to moderate congestion.
(引用元, Kakidai - 投稿者自身による著作物, CC 表示-継承 4.0, リンクによる)
SCORE=9
The intersection in the image is very congested with a large number of pedestrians crossing from multiple directions. This high level of foot traffic suggests significant congestion.
(引用元, Michael Ocampo from United States - Japan Trip 2018 1761, CC 表示 2.0, リンクによる)
ほんの数年前であれば、人物検出のモデルを個別に作成し、混雑度合いを適当に判定させるような問題だったと思います。これが、単に画像を投げて自然言語で問い合わせるだけで、この結果とは…
サンプル3: OCR
手書き文字
2024年5月27日時点で、政治資金規正法の改正が与野党で議論されています。この法律では政治資金収支の公開が義務付けられており、自治体のWebサイト(例:群馬県)で確認できるのですが、例えば適当なキーワードで容易に検索できる状態にはなっていないようです。
確認した範囲ではpdfで公開されていて、フォーマットはある程度決まっている(エクセルのアプリ(!)があるらしい)ようなのですが、中には手書きの紙をスキャンしただけのpdfもあるようです。
ところで、gpt-4oはOCRの精度が向上しているという話を聞きました。こちらの、岸田文雄首相の後援会の収支報告書を題材に、実験してみます。
質問
(画像内のすべてのテキストを抽出してください)
回答
収支報告書
(その1)
(令和4年分)
(関係分)
(ふりが な) きしだふみおこうえんかい
1 政治団体の名称 岸田文雄後援会
(以下略)
この収支報告書には手書き部分はほとんど含まれないのですが、手書きが含まれる場合でも、かなりの精度で認識されることが確認できました。この程度でも、多少はデジタル化が進むかもしれません(が、その前に全体の仕組みを…)。
html
これはSNSで流れていた例ですが、Web画面のイメージを手書きして、適当にプロンプトを作成すると、イメージに見合ったコードを出力してくれるようです。
質問
(画像はWeb画面の構造を手書きで描いたイラストです。この構造を実現するreactのサンプルコードを出力してください)
回答
import React from 'react';
import './App.css';
const App = () => {
return (
<div className="container">
<header className="header">Header</header>
<aside className="menu">Menu</aside>
<main className="content">Contents</main>
</div>
);
};
export default App;
.container {
display: flex;
height: 100vh;
flex-direction: column;
}
.header {
background-color: #f8f9fa;
padding: 1rem;
text-align: center;
border-bottom: 1px solid #dee2e6;
}
(以下略)
もっと複雑な構造にしても対応できるのか、実験を継続中です。
サンプル4: 古典
gpt-3.5-turboが苦手だった問題の一つが、中国の古典(要するに漢文)や日本の古典の扱いでした。gpt-4の時点でかなり解消されていたようですが、gpt-4oでも試してみます。
質問
回答(gpt-3.5-turbo)
「夕知归」ではないでしょうか。
回答(gpt-4o)
「朝聞道」に続く漢字は「夕死可矣」です。これは中国の古典『論語』の一節で、「朝に道を聞かば、夕べに死すとも可なり」という意味です。つまり、「朝に真理や道理を知ることができれば、夕方に死んでも悔いはない」という意味です。
質問
回答(gpt-3.5-turbo)
「しかし、その滅びを遅らせることができるかもしれない」
回答(gpt-4o)
「猛き者も遂には滅びぬ」とくれば、次は「偏に風の前の塵に同じ」です。この一節は『平家物語』の冒頭部分からの引用で、以下のようになります:
「祇園精舎の鐘の声、諸行無常の響きあり。沙羅双樹の花の色、盛者必衰の理をあらはす。奢れる人も久しからず、ただ春の夜の夢のごとし。猛き者も遂には滅びぬ、偏に風の前の塵に同じ。」
この文章は、栄華を極めた者も最終的には滅びてしまうという無常の理を説いています。
軽く実験した範囲ですが、有名どころであれば、かなり正確に答えられているように見えます。
Don’t think, ask!
ここまでの例、特に交差点の混雑度合いの識別と、htmlのソースコード起こしで感じたのですが、AIのパフォーマンスがここまで来ると、人間が考えるより前にとりあえず質問して、聞ける限り聞いて、結果を見て考えるほうが良い結果を生み出せる段階に入ったのかもしれない、と感じています。
去年の段階でも、例えばプログラミングや適当なアイディア出し、翻訳といった個別のテーマなら、ChatGPTを積極的に使うようにはなっていましたが、今後は何事においてもDon’t think, ask! ということですね。
これは単なるツールの使い方の枠を超えて、思考のあり方の変容を求められているのかもしれません。私のようなold typeだと、例えば画像分析の問題に出会った時、教師データを集めて〜とか、モデルを作成して〜とかいう第一感になりがちなのですが、しばらくは「(自分で)考えるな、(AIに)聞け!」と言い聞かせる必要がありそうです。