Gemini の仕様は 2GB の動画をアップロードできると書かれています。私は 30 秒のフィットネス動画をアップロードしましたが、「私はただの言語モデルです」と言われました😂
仕様は「受け取ることができる」だけで、「理解できる」わけではありません
後で動画を圧縮して ChatGPT に送ったところ、右肩が第 12 秒から持ち上がっていると直接教えてくれました。同じ動画なのに、一つは拒否され、もう一つは問題を見つけてくれました
仕様 ≠ 能力
アップロードできる ≠ 分析できる
ツールを選んで実際に何ができるかを見るべきで、何をサポートすると宣伝しているかを見るだけではありません
原文表示