カープラスキーは大規模言語モデル向けのHTML出力を推奨し、究極の形としてインタラクティブなニューラルビデオを予測する

アンドレイ・カラパシーによれば、OpenAIの創設メンバーであり「vibe coding(雰囲気でコーディング)」の概念を生み出した人物である彼は、今日、Claude Codeチームが大規模言語モデルの出力にMarkdownではなくHTMLを使うというアプローチを支持した。カラパシーは、AI対話インターフェースの進化ロードマップを次のように示した。プレーンテキストからMarkdownへ、そしてHTMLへ、さらに複数の中間形態を経て、最終的には拡散モデルによって直接生成されるインタラクティブなニューラルビデオの段階に到達する。

カラパシーは、この進化を人間の脳の帯域幅(バンド幅)に起因するとし、人間の脳の約3分の1が視覚信号を並列に処理していると述べた。情報入力のための「10車線ハイウェイ」だという。彼は、人間とAIの最適なインタラクションは、人間の入力には効率の良い音声を、AIからの出力には高帯域幅の視覚情報(画像、アニメーション、または動画)を組み合わせることだと主張した。彼は、ユーザーが短期的な改善としてプロンプトに「HTMLとして構造化された返信を追加する」ことをすぐに行うよう勧めた。

免責事項:本ページの情報には第三者提供の内容が含まれる場合があり、参考目的のみで提供されています。これらはGateの見解や意見を示すものではなく、金融、投資、または法律上の助言を構成するものでもありません。暗号資産取引には高いリスクが伴います。意思決定を行う際には、本ページの情報のみに依存しないでください。詳細については、免責事項をご確認ください。
コメント
0/400
コメントなし